2.3. 使用 Cluster Observability Operator 事件检测
先决条件
-
您可以使用具有
cluster-admin集群角色的用户身份访问集群。 - 已登陆到 OpenShift Container Platform Web 控制台。
- 已安装 Cluster Observability Operator。
- 已安装启用了事件检测的 Cluster Observability Operator 监控 UI 插件。
如果您以编程方式安装 Cluster Observability Operator,请确保命名空间(默认为 openshift-cluster-observability-operator)具有标签 openshift.io/cluster-monitoring=true。如果没有通过运行 comand 添加它:
$ oc label namespace openshift-cluster-observability-operator openshift.io/cluster-monitoring=true
流程
-
在 Web 控制台的 Administrator 视角中,点 Observe
Alerting 并选择 Incidents 选项卡。 Incidents Timeline UI 显示分组的警报作为事件。图中行的不同颜色与事件中的不同严重性对应。默认情况下会显示 7 天时间线。
注意在启用事件检测后,至少需要五分钟来处理关联性和时间表。
状态更改会以五分钟的间隔记录。您可以看到时间表旁边的最后更新时间。
只有在启用了此功能后,才会对触发的警报执行分析和分组。在功能启用前已解决的警报。
点下拉菜单来指定持续时间,缩放到 1 天范围的视图。
注意出于性能考虑,UI 只加载显示的数据。开始时间反映了当前时间表中呈现的第一个数据点,而不是警报的绝对开始时间。例如,如果您缩放至 1 天,并且启动了两天前的警报,则开始时间将移到四小时前。
通过点事件,您可以在 Alerts Timeline UI 中查看作为该事件一部分的警报时间线。
在后续警报列表中,警报映射到特定组件,按严重性分组。
点击以展开列表中的组件。此时会显示与该组件相关的底层警报。
- 点警报的链接,查看相关警报规则的详细信息。