1.8. Grafana 警报(技术预览)
您可以配置三个 Grafana 警报,它们存储在 multicluster-global-hub-default-alerting 配置映射中。这些警报通知您可疑策略、可疑集群合规状态更改和失败的 cron 作业。
请参阅以下警报描述:
可疑策略更改:此警报规则监视可疑策略更改。如果以下事件在一小时内发生超过五分钟,它会创建通知。
- 一个策略被启用或禁用。
- 一个策略已更新。
可疑集群合规状态更改:此警报规则监视集群的合规状态和策略事件。此警报有两个规则:
-
集群合规状态经常更改:如果集群合规状态在一小时内从
合规更改为非合规多次,它会创建通知。 -
集群中的策略事件太多:对于集群中的策略,如果五分钟内有超过 20 个事件,它会创建通知。如果此警报始终触发,则
event.local_policies表中的数据会变得太快。
-
集群合规状态经常更改:如果集群合规状态在一小时内从
Cron Job failed :此警报监视 cron 任务,如 为失败的事件 配置 cron 作业 中所述。此警报有两个规则:
-
本地合规作业失败:如果此警报规则创建通知,这意味着本地合规状态同步作业失败。可能会导致
history.local_compliance表中的数据丢失。如有必要,手动运行作业。 - 数据保留作业失败:如果此警报规则开始创建通知,这意味着数据保留作业失败。您可以手动运行它。
-
本地合规作业失败:如果此警报规则创建通知,这意味着本地合规状态同步作业失败。可能会导致
1.8.1. 删除默认的 Grafana 警报规则 复制链接链接已复制到粘贴板!
如果默认的 Grafana 警报规则不提供有用的信息,您可以通过在 multicluster-global-hub-custom-alerting 配置映射中包含 deleteRules 部分来删除 Grafana 警报规则。如需有关 multicluster-global-hub-custom-alerting 配置映射的更多信息,请参阅自定义 Grafana 警报资源。
要删除所有默认警报,deleteRules 配置部分应类似以下示例:
1.8.2. 自定义 Grafana 警报 复制链接链接已复制到粘贴板!
multicluster global hub 支持创建自定义 Grafana 警报。完成以下步骤以自定义 Grafana 警报:
1.8.2.1. 自定义 grafana.ini 文件 复制链接链接已复制到粘贴板!
要自定义 grafana.ini 文件,请在安装 multicluster global hub operator 的命名空间中创建一个名为 multicluster-global-hub-custom-grafana-config 的 secret。secret 数据密钥是 grafana.ini,如下例所示。将所需信息替换为您自己的凭证:
<1> the EHLO 身份在 SMTP 对话框中,默认为 instance_name。
注: 您无法配置已包含 multicluster-global-hub-default-grafana-config secret 的部分。
1.8.2.2. 自定义 Grafana 警报资源 复制链接链接已复制到粘贴板!
multicluster global hub 支持自定义警报资源,如 Grafana 文档中的使用文件置备创建和管理警报资源 中所述。
要自定义警报资源,请在 multicluster-global-hub -hub 命名空间中创建一个名为 multicluster-global-hub-custom-alerting 的配置映射。
配置映射数据键是 alerting.yaml,如下例所示: