1.8. Grafana 警报(技术预览)
您可以配置三个 Grafana 警报,它们存储在 multicluster-global-hub-default-alerting 配置映射中。这些警报通知您可疑策略、可疑集群合规状态更改和失败的 cron 作业。
请参阅以下警报描述:
可疑策略更改:此警报规则监视可疑策略更改。如果以下事件在一小时内发生超过五分钟,它会创建通知。
- 一个策略被启用或禁用。
- 一个策略已更新。
可疑集群合规状态更改:此警报规则监视集群的合规状态和策略事件。此警报有两个规则:
-
集群合规状态经常更改:如果集群合规状态在一小时内从
合规更改为非合规多次,它会创建通知。 -
集群中的策略事件太多:对于集群中的策略,如果五分钟内有超过 20 个事件,它会创建通知。如果此警报始终触发,则
event.local_policies表中的数据会变得太快。
-
集群合规状态经常更改:如果集群合规状态在一小时内从
Cron Job failed :此警报监视 cron 任务,如 为失败的事件 配置 cron 作业 中所述。此警报有两个规则:
-
本地合规作业失败:如果此警报规则创建通知,这意味着本地合规状态同步作业失败。可能会导致
history.local_compliance表中的数据丢失。如有必要,手动运行作业。 - 数据保留作业失败:如果此警报规则开始创建通知,这意味着数据保留作业失败。您可以手动运行它。
-
本地合规作业失败:如果此警报规则创建通知,这意味着本地合规状态同步作业失败。可能会导致
1.8.1. 删除默认的 Grafana 警报规则 复制链接链接已复制到粘贴板!
如果默认的 Grafana 警报规则不提供有用的信息,您可以通过在 multicluster-global-hub-custom-alerting 配置映射中包含 deleteRules 部分来删除 Grafana 警报规则。如需有关 multicluster-global-hub-custom-alerting 配置映射的更多信息,请参阅自定义 Grafana 警报资源。
要删除所有默认警报,deleteRules 配置部分应类似以下示例:
deleteRules:
- orgId: 1
uid: globalhub_suspicious_policy_change
- orgId: 1
uid: globalhub_cluster_compliance_status_change_frequently
- orgId: 1
uid: globalhub_high_number_of_policy_events
- orgId: 1
uid: globalhub_data_retention_job
- orgId: 1
uid: globalhub_local_compliance_job
1.8.2. 自定义 Grafana 警报 复制链接链接已复制到粘贴板!
multicluster global hub 支持创建自定义 Grafana 警报。完成以下步骤以自定义 Grafana 警报:
1.8.2.1. 自定义 grafana.ini 文件 复制链接链接已复制到粘贴板!
要自定义 grafana.ini 文件,请在安装 multicluster global hub operator 的命名空间中创建一个名为 multicluster-global-hub-custom-grafana-config 的 secret。secret 数据密钥是 grafana.ini,如下例所示。将所需信息替换为您自己的凭证:
apiVersion: v1
kind: Secret
metadata:
name: multicluster-global-hub-custom-grafana-config
namespace: multicluster-global-hub
type: Opaque
stringData:
grafana.ini: |
[smtp]
enabled = true
host = smtp.google.com:465
user = <example@google.com>
password = <password>
;cert_file =
;key_file =
skip_verify = true
from_address = <example@google.com>
from_name = Grafana
;ehlo_identity = dashboard.example.com
<1> the EHLO 身份在 SMTP 对话框中,默认为 instance_name。
注: 您无法配置已包含 multicluster-global-hub-default-grafana-config secret 的部分。
1.8.2.2. 自定义 Grafana 警报资源 复制链接链接已复制到粘贴板!
multicluster global hub 支持自定义警报资源,如 Grafana 文档中的使用文件置备创建和管理警报资源 中所述。
要自定义警报资源,请在 multicluster-global-hub -hub 命名空间中创建一个名为 multicluster-global-hub-custom-alerting 的配置映射。
配置映射数据键是 alerting.yaml,如下例所示:
apiVersion: v1
data:
alerting.yaml: |
contactPoints:
- orgId: 1
name: globalhub_policy
receivers:
- uid: globalhub_policy_alert_email
type: email
settings:
addresses: <example@redhat.com>
singleEmail: false
- uid: globalhub_policy_alert_slack
type: slack
settings:
url: <Slack-webhook-URL>
title: |
{{ template "globalhub.policy.title" . }}
text: |
{{ template "globalhub.policy.message" . }}
policies:
- orgId: 1
receiver: globalhub_policy
group_by: ['grafana_folder', 'alertname']
matchers:
- grafana_folder = Policy
repeat_interval: 1d
deleteRules:
- orgId: 1
uid: [Alert Rule Uid]
muteTimes:
- orgId: 1
name: mti_1
time_intervals:
- times:
- start_time: '06:00'
end_time: '23:59'
location: 'UTC'
weekdays: ['monday:wednesday', 'saturday', 'sunday']
months: ['1:3', 'may:august', 'december']
years: ['2020:2022', '2030']
days_of_month: ['1:5', '-3:-1']
kind: ConfigMap
metadata:
name: multicluster-global-hub-custom-alerting
namespace: multicluster-global-hub