1.8. Grafana 警报(技术预览)
您可以配置三个 Grafana 警报,它们存储在 multicluster-global-hub-default-alerting 配置映射中。这些警报会通知您可疑的策略、可疑的集群合规状态更改以及失败的 cron 作业。
请参阅以下警报描述:
可疑策略更改:此警报规则监视可疑策略的变化。如果以下事件在一小时内发生超过五次,它会创建通知。
- 一个策略被启用或禁用。
- 已更新策略。
可疑的集群合规状态更改:此警报规则监视集群的合规状态和策略事件。这个警报有两个规则:
-
集群合规状态会频繁变化:如果集群合规状态在 1 小时内从合规状态变为
non-,它将创建通知。compliance -
集群中的策略事件太多:对于集群中的策略,如果五分钟内有 20 个事件,则创建通知。如果此警报总是触发,则
event.local_policies表中的数据会太快。
-
集群合规状态会频繁变化:如果集群合规状态在 1 小时内从合规状态变为
Cron Job 失败:此警报会监视在为失败事件 配置 cron 作业 中描述的 cron 作业。这个警报有两个规则:
-
本地合规作业失败:如果此警报规则创建通知,这意味着本地合规状态同步作业失败。可能会导致
history.local_compliance表中的数据丢失。如有必要,手动运行作业。 - 数据保留作业失败:如果此警报规则开始创建通知,这意味着数据保留作业失败。您可以手动运行它。
-
本地合规作业失败:如果此警报规则创建通知,这意味着本地合规状态同步作业失败。可能会导致
1.8.1. 删除默认的 Grafana 警报规则 复制链接链接已复制到粘贴板!
如果默认 Grafana 警报规则不提供有用的信息,您可以通过在 multicluster-global-hub-custom-alerting 配置映射中包含 deleteRules 部分来删除 Grafana 警报规则。如需有关 multicluster-global-hub-custom-alerting 配置映射的更多信息,请参阅自定义 Grafana 警报资源。
要删除所有默认警报,deleteRules 配置部分应类似以下示例:
1.8.2. 自定义 Grafana 警报 复制链接链接已复制到粘贴板!
multicluster global hub 支持创建自定义 Grafana 警报。完成以下步骤以自定义 Grafana 警报:
1.8.2.1. 自定义 grafana.ini 文件 复制链接链接已复制到粘贴板!
要自定义 grafana.ini 文件,请在安装 multicluster-global-hub-custom-grafana-config 命名空间中创建一个名为 multicluster-global-hub-custom-grafana-config 的 secret。secret 数据键是 grafana.ini,如下例所示。使用您自己的凭证替换所需的信息:
<1> the EHLO 身份在 SMTP 对话框中,默认为 instance_name。
注: 您无法配置已包含 multicluster-global-hub-default-grafana-config secret 的部分。
1.8.2.2. 自定义 Grafana 警报资源 复制链接链接已复制到粘贴板!
multicluster global hub 支持自定义警报资源,如 Grafana 文档中的使用文件置备来创建和管理警报资源。
要自定义警报资源,请在 multicluster-global-hub 命名空间中创建一个名为 multicluster-global-hub-custom-alerting 的配置映射。
配置映射数据键是 alerting.yaml,如下例所示: