14.2. 监控 Cruise Control 操作


Cruise Control 监控 Kafka 代理,以跟踪代理、主题和分区的利用率。Cruise Control 还提供一组指标来监控其自身的性能。

Cruise Control 指标报告程序从 Kafka 代理收集原始指标数据。数据生成给由 Cruise Control 自动创建的主题。指标 用于为 Kafka 集群生成优化建议

Cruise Control 指标可用于对 Cruise Control 操作进行实时监控。例如,您可以使用 Cruise Control 指标来监控运行重新平衡操作的状态,或针对操作性能中检测到的任何异常情况提供警报。

您可以通过在 Cruise Control 配置中启用 Prometheus JMX Exporter 来公开 Cruise Control 指标。

注意

有关可用 Cruise Control 指标的完整列表,称为 sensors,请参阅 Cruise Control 文档

14.2.1. 公开 Cruise Control 指标

如果要在 Cruise Control 操作上公开指标,请将 Kafka 资源配置为 部署 Cruise Control 并在部署中启用 Prometheus 指标。您可以使用自己的配置,或使用 AMQ Streams 提供的 kafka-cruise-control-metrics.yaml 文件示例。

您可以将配置添加到 Kafka 资源中的 CruiseControl 属性的 metricsConfig 中。配置可让 Prometheus JMX Exporter 通过 HTTP 端点公开 Cruise Control 指标。HTTP 端点由 Prometheus 服务器提取。

Cruise Control 的指标配置示例

  apiVersion: kafka.strimzi.io/v1beta2
  kind: Kafka
  metadata:
    name: my-cluster
  Spec:
    # ...
    cruiseControl:
      # ...
      metricsConfig:
        type: jmxPrometheusExporter
        valueFrom:
          configMapKeyRef:
            name: cruise-control-metrics
            key: metrics-config.yml
  ---
  kind: ConfigMap
  apiVersion: v1
  metadata:
    name: cruise-control-metrics
    labels:
      app: strimzi
  data:
    metrics-config.yml: |
    # metrics configuration...
Copy to Clipboard Toggle word wrap

14.2.2. 查看 Cruise Control 指标

公开 Cruise Control 指标后,您可以使用 Prometheus 或其他适当的监控系统查看指标数据的信息。AMQ Streams 提供了一个 Grafana 仪表板示例,用于显示 Cruise Control 指标的视觉化。仪表板是名为 strimzi-cruise-control.json 的 JSON 文件。在启用 Grafana 仪表板时,公开的指标 提供监控数据。

14.2.2.1. 监控均衡分数

Cruise Control 指标包括平衡分数。Balancedness 是在 Kafka 集群中平均分配工作负载的方法。

用于均衡分数的 Cruise Control 指标(balancedness-score)可能与 KafkaRebalance 资源中的均衡分数不同。Cruise Control 使用 aoma ly.detection.goals 计算每个分数,它可能与 KafkaRebalance 资源中使用的 default.goals 不同。a omaly.detection.goalsKafka 自定义资源的 spec.cruiseControl.config 中指定。

注意

刷新 KafkaRebalance 资源获取优化提议。如果满足以下条件之一,则会获取最新的缓存的优化建议:

  • KafkaRebalance 目标Kafka 资源的 default.goals 部分中配置的目标匹配
  • 未指定 KafkaRebalance 目标

否则,Cruise Control 会根据 KafkaRebalance 目标 生成一个新的优化建议。如果每次刷新中都会生成新的提议,这可能会影响性能监控。

14.2.2.2. 异常检测中的警报

Cruise Control 的 omaly detector 提供了阻止生成优化目标(如代理故障)的条件的指标数据。如果要提高可见性,您可以使用 anomaly detector 提供的指标来设置警报并发送通知。您可以设置 Cruise Control 的 anomaly notifier,以根据这些指标通过指定的通知频道路由警报。另外,您可以设置 Prometheus 来提取 aomaly detector 提供的指标数据并生成警报。然后,Prometheus Alertmanager 可以路由 Prometheus 生成的警报。

Cruise Control 文档 提供有关 AnomalyDetector 指标和 aomaly notifier 的信息。

返回顶部
Red Hat logoGithubredditYoutubeTwitter

学习

尝试、购买和销售

社区

关于红帽文档

通过我们的产品和服务,以及可以信赖的内容,帮助红帽用户创新并实现他们的目标。 了解我们当前的更新.

让开源更具包容性

红帽致力于替换我们的代码、文档和 Web 属性中存在问题的语言。欲了解更多详情,请参阅红帽博客.

關於紅帽

我们提供强化的解决方案,使企业能够更轻松地跨平台和环境(从核心数据中心到网络边缘)工作。

Theme

© 2025 Red Hat