20.2. 监控 Cruise Control 操作
Cruise Control 监控 Kafka 代理,以跟踪代理、主题和分区的利用率。Cruise Control 还提供一组指标来监控其自身的性能。
Cruise Control 指标报告器从 Kafka 代理收集原始指标数据。数据由 Cruise Control 自动创建的主题生成。指标 用于生成 Kafka 集群的优化建议。
Cruise Control 指标可用于实时监控 Cruise Control 操作。例如,您可以使用 Cruise Control 指标监控运行重新平衡操作的状态,或在操作性能中检测到的任何异常情况提供警报。
您可以通过在 Cruise Control 配置中启用 Prometheus JMX Exporter 来公开 Cruise Control 指标。
有关可用 Cruise Control 指标的完整列表,称为 sensors,请参阅 Cruise Control 文档
20.2.1. 监控平衡分数 复制链接链接已复制到粘贴板!
Cruise Control 指标包括平衡分数。Balancedness 是 Kafka 集群中平均分布工作负载的测量。
平衡分数的 Cruise Control 指标(balancedness-score)可能与 KafkaRebalance 资源中的均衡分数不同。Cruise Control 使用 anomaly.detection.goals 计算每个分数,这些分数可能与 KafkaRebalance 资源中使用的 default.goals 不同。anomaly.detection.goals 在 Kafka 自定义资源的 spec.cruiseControl.config 中指定。
刷新 KafkaRebalance 资源获取优化提议。如果满足以下条件之一,则会获取最新的缓存的优化方案:
-
KafkaRebalance
目标与Kafka资源的default.goals部分中配置的目标匹配 -
未指定 KafkaRebalance
目标
否则,Cruise Control 会根据 KafkaRebalance 目标 生成新的优化建议。如果每次刷新时生成新提议,这可能会影响性能监控。
20.2.2. 为异常检测设置警报 复制链接链接已复制到粘贴板!
Cruise Control 的 omaly detector 提供了阻止生成优化目标(如代理故障)的条件的指标数据。如果要提高可见性,您可以使用 anomaly detector 提供的指标来设置警报并发送通知。您可以设置 Cruise Control 的 anomaly notifier,以通过指定的通知频道根据这些指标路由警报。另外,您可以设置 Prometheus 来提取 anomaly detector 提供的指标数据并生成警报。然后 Prometheus Alertmanager 可以路由 Prometheus 生成的警报。
Cruise Control 文档 提供有关 AnomalyDetector 指标和 anomaly notifier 的信息。