3.5. 监管指标
策略框架公开指标来显示策略分布和合规性。在 hub 集群中使用 policy_governance_info 指标来查看趋势并分析任何策略失败。有关指标概述,请参阅以下主题:
3.5.1. Metric: policy_governance_info 复制链接链接已复制到粘贴板!
OpenShift Container Platform 监控组件会收集 policy_governance_info 指标。如果启用可观察性,组件会收集一些聚合数据。
注: 如果启用可观察性,请从 Grafana Explore 页面输入对指标的查询。创建策略时,您要创建一个 root 策略。框架监视根策略、放置 资源和 PlacementBindings 资源,以获取有关创建 传播策略的 位置的信息,以将策略分发到受管集群。
对于根和传播策略,如果策略合规,则会记录 0 的指标,如果策略不合规,则记录 1 ;如果它处于 unknown 或 pending 状态,则会记录 1。
policy_governance_info 指标使用以下标签:
-
type:标签值为root或propagated。 -
policy:关联的根策略的名称。 -
policy_namespace:定义根策略的 hub 集群上命名空间。 -
cluster_namespace:分发策略的集群的命名空间。
这些标签和值启用查询来显示集群中可能发生的许多事情,这些情况可能很难跟踪。
注: 如果您不需要指标数据,且对性能或安全性有任何顾虑,您可以禁用指标集合。在传播器部署中,将 DISABLE_REPORT_METRICS 环境变量设置为 true。您还可以将 policy_governance_info 指标添加到 observability allowlist 作为自定义指标。如需了解更多详细信息,请参阅 添加自定义指标。
3.5.2. metric: cluster_policy_governance_info 复制链接链接已复制到粘贴板!
OpenShift Container Platform 监控组件会收集 cluster_policy_governance_info 指标。如果启用可观察性,组件会收集数据。
注: 如果启用可观察性,请从 Grafana Explore 页面输入对指标的查询。
对于受管集群策略,如果策略合规,则会记录 0 的指标,如果策略不合规,则记录 1 ;如果它处于 unknown 或 pending 状态,则会记录 -1。
cluster_policy_governance_info 指标使用以下标签:
-
kind: 策略的类型。 -
策略:策略的名称。 -
policy_namespace:定义策略的受管集群中的命名空间。 -
严重性:在策略上指定的严重性。
使用这些标签和值来对集群中更改启用详细的查询,但可能很难跟踪。
注: 您还可以将 cluster_policy_governance_info 指标添加到 observability allowlist 中作为自定义指标。如需了解更多详细信息,请参阅 添加自定义指标。
config_policies_evaluation_duration_seconds 直方图跟踪集群中准备好评估的所有配置策略所需的秒数。使用以下指标查询直方图:
-
config_policies_evaluation_duration_seconds_bucket:存储桶是累积的,以秒为单位的以下可能的值:1, 3, 9, 10.5, 15, 30, 60, 90, 90, 120, 180, 300, 450, 600 等。 -
config_policies_evaluation_duration_seconds_count: 所有事件的计数。 -
config_policies_evaluation_duration_seconds_sum: 所有值的总和。
使用 config_policies_evaluation_duration_seconds 指标来确定 ConfigurationPolicy evaluationInterval 设置是否需要为不需要频繁评估的资源密集型策略更改。您还可以以 Kubernetes API 服务器的资源使用率更高的成本增加并发性。如需了解更多详细信息,请参阅配置并发 部分。
要接收有关评估配置策略的时间的信息,请执行类似以下表达式的 Prometheus 查询:
rate(config_policies_evaluation_duration_seconds_sum[10m])/rate (config_policies_evaluation_duration_seconds_count[10m]
open-cluster-management-agent-addon 命名空间中的受管集群上运行的 config-policy-controller pod 会计算指标。config-policy-controller 默认不会将指标发送到可观察性。