1.8. Grafana 警报(技术预览)
您可以配置三个 Grafana 警报,它们存储在 multicluster-global-hub-default-alerting
配置映射中。这些警报通知您可疑策略、可疑集群合规状态更改和失败的 cron 作业。
请参阅以下警报描述:
可疑策略更改:此警报规则监视可疑策略更改。如果以下事件在一小时内发生超过五分钟,它会创建通知。
- 一个策略被启用或禁用。
- 一个策略已更新。
可疑集群合规状态更改:此警报规则监视集群的合规状态和策略事件。此警报有两个规则:
-
集群合规状态经常更改:如果集群合规状态在一小时内从
合规
更改为非合规
多次,它会创建通知。 -
集群中的策略事件太多:对于集群中的策略,如果五分钟内有超过 20 个事件,它会创建通知。如果此警报始终触发,则
event.local_policies
表中的数据会变得太快。
-
集群合规状态经常更改:如果集群合规状态在一小时内从
Cron Job failed :此警报监视 cron 任务,如 为失败的事件 配置 cron 作业 中所述。此警报有两个规则:
-
本地合规作业失败:如果此警报规则创建通知,这意味着本地合规状态同步作业失败。可能会导致
history.local_compliance
表中的数据丢失。如有必要,手动运行作业。 - 数据保留作业失败:如果此警报规则开始创建通知,这意味着数据保留作业失败。您可以手动运行它。
-
本地合规作业失败:如果此警报规则创建通知,这意味着本地合规状态同步作业失败。可能会导致
1.8.1. 删除默认的 Grafana 警报规则
如果默认的 Grafana 警报规则不提供有用的信息,您可以通过在 multicluster-global-hub-custom-alerting
配置映射中包含 deleteRules
部分来删除 Grafana 警报规则。如需有关 multicluster-global-hub-custom-alerting
配置映射的更多信息,请参阅自定义 Grafana 警报资源。
要删除所有默认警报,deleteRules
配置部分应类似以下示例:
deleteRules: - orgId: 1 uid: globalhub_suspicious_policy_change - orgId: 1 uid: globalhub_cluster_compliance_status_change_frequently - orgId: 1 uid: globalhub_high_number_of_policy_events - orgId: 1 uid: globalhub_data_retention_job - orgId: 1 uid: globalhub_local_compliance_job
1.8.2. 自定义 Grafana 警报
multicluster global hub 支持创建自定义 Grafana 警报。完成以下步骤以自定义 Grafana 警报:
1.8.2.1. 自定义 grafana.ini 文件
要自定义 grafana.ini
文件,请在安装 multicluster global hub operator 的命名空间中创建一个名为 multicluster-global-hub-custom-grafana-config
的 secret。secret 数据密钥是 grafana.ini
,如下例所示。将所需信息替换为您自己的凭证:
apiVersion: v1
kind: Secret
metadata:
name: multicluster-global-hub-custom-grafana-config
namespace: multicluster-global-hub
type: Opaque
stringData:
grafana.ini: |
[smtp]
enabled = true
host = smtp.google.com:465
user = <example@google.com>
password = <password>
;cert_file =
;key_file =
skip_verify = true
from_address = <example@google.com>
from_name = Grafana
;ehlo_identity = dashboard.example.com 1
<1> the EHLO
身份在 SMTP
对话框中,默认为 instance_name
。
注: 您无法配置已包含 multicluster-global-hub-default-grafana-config
secret 的部分。
1.8.2.2. 自定义 Grafana 警报资源
multicluster global hub 支持自定义警报资源,如 Grafana 文档中的使用文件置备创建和管理警报资源 中所述。
要自定义警报资源,请在 multicluster-global-hub
-hub 命名空间中创建一个名为 multicluster-global-hub-custom-alerting
的配置映射。
配置映射数据键是 alerting.yaml
,如下例所示:
apiVersion: v1 data: alerting.yaml: | contactPoints: - orgId: 1 name: globalhub_policy receivers: - uid: globalhub_policy_alert_email type: email settings: addresses: <example@redhat.com> singleEmail: false - uid: globalhub_policy_alert_slack type: slack settings: url: <Slack-webhook-URL> title: | {{ template "globalhub.policy.title" . }} text: | {{ template "globalhub.policy.message" . }} policies: - orgId: 1 receiver: globalhub_policy group_by: ['grafana_folder', 'alertname'] matchers: - grafana_folder = Policy repeat_interval: 1d deleteRules: - orgId: 1 uid: [Alert Rule Uid] muteTimes: - orgId: 1 name: mti_1 time_intervals: - times: - start_time: '06:00' end_time: '23:59' location: 'UTC' weekdays: ['monday:wednesday', 'saturday', 'sunday'] months: ['1:3', 'may:august', 'december'] years: ['2020:2022', '2030'] days_of_month: ['1:5', '-3:-1'] kind: ConfigMap metadata: name: multicluster-global-hub-custom-alerting namespace: multicluster-global-hub