5.4. 管理警报规则

PDF

OpenShift Container Platform 监控附带一组默认的警报规则。作为集群管理员，您可以查看默认警报规则。

在 OpenShift Container Platform 4.6 中，您可以在用户定义的项目中创建、查看、编辑和删除警报规则。

警报规则注意事项

默认的警报规则专门用于 OpenShift Container Platform 集群。
有些警报规则特意使用相同的名称。它们发送关于同一事件但具有不同阈值和/或不同严重性的警报。
如果较低严重性警报在较高严重性警报触发的同时触发，禁止规则可防止在这种情况下发送通知。

5.4.1. 为用户定义的项目优化警报

要优化您自己的项目的警报，您可以在创建警报规则时考虑以下建议：

尽可能减少您为项目创建的警报规则数量。创建警报规则来针对会影响您的条件通知您。如果您为不会影响您的条件生成多个警报，则更难以注意到相关警报。
为症状而不是原因创建警报规则。创建警报规则来针对条件通知您，而无论根本原因是什么。然后可以调查原因。如果每个警报规则都只与特定原因相关，则需要更多警报规则。然后，可能会错过一些原因。
在编写警报规则前进行规划。确定对您很重要的症状以及一旦发生您想要采取什么操作。然后为每个症状构建警报规则。
提供明确的警报信息。在警报消息中说明症状和推荐操作。
在警报规则中包含严重性级别。警报的严重性取决于当报告的症状发生时您需要如何做出反应。例如，如果症状需要个人或关键响应团队立即关注，就应该触发关键警报。
优化警报路由。如果警报规则不查询默认的 OpenShift Container Platform 指标，则直接在 openshift-user-workload-monitoring 项目的 Prometheus 实例上部署该规则。这可减少警报规则的延迟，并尽可能降低监控组件的负载。
警告
用户定义的项目的默认 OpenShift Container Platform 指标提供有关 CPU 和内存用量、带宽统计和数据包速率的信息。如果您将规则直接路由到 openshift-user-workload-monitoring 项目中的 Prometheus 实例，则无法将这些指标包含在警报规则中。只有在您阅读了文档并对监控架构有了全面的了解后，才应使用警报规则优化。

其他资源

如需更多有关优化警报的指南，请参阅 Prometheus 警报文档
如需了解有关 OpenShift Container Platform 4.6 监控架构的详细信息，请参阅监控概述

5.4. 管理警报规则

5.4.1. 为用户定义的项目优化警报

学习

尝试、购买和销售

社区

关于红帽文档

让开源更具包容性

關於紅帽

Red Hat legal and privacy links

Red Hat legal and privacy links