20.2. 监控 Cruise Control 操作
Cruise Control 监控 Kafka 代理,以跟踪代理、主题和分区的利用率。Cruise Control 还提供一组指标来监控其自身的性能。
Cruise Control 指标报告程序从 Kafka 代理收集原始指标数据。数据生成给由 Cruise Control 自动创建的主题。指标 用于为 Kafka 集群生成优化建议。
Cruise Control 指标可用于对 Cruise Control 操作进行实时监控。例如,您可以使用 Cruise Control 指标来监控运行重新平衡操作的状态,或针对操作性能中检测到的任何异常情况提供警报。
您可以通过在 Cruise Control 配置中启用 Prometheus JMX Exporter 来公开 Cruise Control 指标。
有关可用 Cruise Control 指标的完整列表,称为 sensors,请参阅 Cruise Control 文档
20.2.1. 监控均衡分数 复制链接链接已复制到粘贴板!
Cruise Control 指标包括平衡分数。Balancedness 是在 Kafka 集群中平均分配工作负载的方法。
用于均衡分数的 Cruise Control 指标(balancedness-score)可能与 KafkaRebalance 资源中的均衡分数不同。Cruise Control 使用 aoma ly.detection.goals 计算每个分数,它可能与 KafkaRebalance 资源中使用的 default.goals 不同。a omaly.detection.goals 在 Kafka 自定义资源的 spec.cruiseControl.config 中指定。
刷新 KafkaRebalance 资源获取优化提议。如果满足以下条件之一,则会获取最新的缓存的优化建议:
-
KafkaRebalance
目标与Kafka资源的default.goals部分中配置的目标匹配 -
未指定 KafkaRebalance
目标
否则,Cruise Control 会根据 KafkaRebalance 目标 生成一个新的优化建议。如果每次刷新中都会生成新的提议,这可能会影响性能监控。
20.2.2. 为异常检测设置警报 复制链接链接已复制到粘贴板!
Cruise Control 的 omaly detector 提供了阻止生成优化目标(如代理故障)的条件的指标数据。如果要提高可见性,您可以使用 anomaly detector 提供的指标来设置警报并发送通知。您可以设置 Cruise Control 的 anomaly notifier,以根据这些指标通过指定的通知频道路由警报。另外,您可以设置 Prometheus 来提取 aomaly detector 提供的指标数据并生成警报。然后,Prometheus Alertmanager 可以路由 Prometheus 生成的警报。
Cruise Control 文档 提供有关 AnomalyDetector 指标和 aomaly notifier 的信息。