1.2.17.2. 对规则更改的警报
OpenShift Container Platform 4.6 包括以下警报规则的变化:
-
添加了
PrometheusOperatorListErrors
警报。该警报在控制器上运行列表操作时提供错误通知。 -
添加了
PrometheusOperatorWatchErrors
警报。该警报提供在控制器上运行监视操作时出现的错误通知。 -
KubeQuotaExceeded
警报由KubeQuotaFullyUsed
替代。在以前的版本中,如果资源配额超过 90% 阈值,则KubeQuotaExceeded
警报会触发。如果完全使用资源配额,则KubeQuotaFullyUsed
警报会触发。 - etcd 警报现在支持为指标添加自定义标签。
-
KubeAPILatencyHigh
和KubeAPIErrorsHigh
警报由KubeAPIErrorBudgetBurn
警报替代。KubeAPIErrorBudgetBurn
组合了 API 错误和延迟警报,仅在条件足够严重时才会触发。 - 现在,kubelet 公开的就绪度和存活度探测指标会被抓取。这提供了容器的历史存活度和就绪度数据,这在对容器问题进行故障排除时非常有用。
- Thanos Ruler 的警报规则会被更新,在没有正确评估记录规则和警报规则时,会把警报进行分页。在这个版本中,当 Thanos Ruler 中的规则及警报评估没有完成时,重要警报不会被丢失。
-
KubeStatefulSetUpdateNotRolledOut
警报被更新,以便在部署有状态的集合时不会触发。 -
KubeDaemonSetRolloutStuck
警报已更新,以考虑守护进程设置推出进度。 - 基于原因的警报的严重性从 critical 调整为 warning。
注意
红帽不保证指标、记录规则或警报规则的向后兼容。