第 3 章 配置监控堆栈
本节介绍支持什么配置,演示了如何为用户定义的项目配置监控堆栈,并演示了一些常见的配置场景。
并非所有监控堆栈的配置参数都会被公开。只有在 Cluster Monitoring Operator 的 Config map 引用中列出的参数和字段才支持进行配置。
3.1. 对监控的维护和支持
并非所有监控堆栈配置选项都公开。配置 Red Hat OpenShift Service on AWS 监控的唯一方法是,使用 Cluster Monitoring Operator 的 Config map 引用中所述的选项来配置 Cluster Monitoring Operator (CMO)。请勿使用其他配置,因为不受支持。
各个 Prometheus 发行版本的配置范例可能会有所变化,只有掌握了所有可能的配置,才能稳妥应对这样的配置变化。如果您使用 Cluster Monitoring Operator 的 Config map 引用 中描述的配置以外的配置,您的更改可能会消失,因为 CMO 会自动协调任何差异,并将任何不支持的更改重置为最初定义的状态,并按设计进行重置。
Red Hat Site Reliability 工程师(SRE)不支持安装另一个 Prometheus 实例。
3.1.1. 对监控的支持注意事项
指标、记录规则或警报规则的向后兼容性无法被保证。
明确不支持以下修改:
- 在 Red Hat OpenShift Service on AWS 上安装自定义 Prometheus 实例。自定义资源 (CR) 是由 Prometheus Operator 管理的 Prometheus 自定义资源 (CR)。
-
修改默认平台监控组件。您不应该修改
cluster-monitoring-config
配置映射中定义的任何组件。Red Hat SRE 使用这些组件来监控核心集群组件和 Kubernetes 服务。
3.1.2. 监控组件的支持版本列表
以下列表包含有关 Red Hat OpenShift Service on AWS 4.12 及更新版本的监控组件版本的信息:
Red Hat OpenShift Service on AWS | Prometheus Operator | Prometheus | 指标服务器 | Alertmanager | kube-state-metrics 代理 | monitoring-plugin | node-exporter 代理 | Thanos |
---|---|---|---|---|---|---|---|---|
4.17 | 0.75.2 | 2.53.1 | 0.7.1 | 0.27.0 | 2.13.0 | 1.0.0 | 1.8.2 | 0.35.1 |
4.16 | 0.73.2 | 2.52.0 | 0.7.1 | 0.26.0 | 2.12.0 | 1.0.0 | 1.8.0 | 0.35.0 |
4.15 | 0.70.0 | 2.48.0 | 0.6.4 | 0.26.0 | 2.10.1 | 1.0.0 | 1.7.0 | 0.32.5 |
4.14 | 0.67.1 | 2.46.0 | N/A | 0.25.0 | 2.9.2 | 1.0.0 | 1.6.1 | 0.30.2 |
4.13 | 0.63.0 | 2.42.0 | N/A | 0.25.0 | 2.8.1 | N/A | 1.5.0 | 0.30.2 |
4.12 | 0.60.1 | 2.39.1 | N/A | 0.24.0 | 2.6.0 | N/A | 1.4.0 | 0.28.1 |
openshift-state-metrics 代理和 Telemeter Client 是特定于 OpenShift 的组件。因此,它们的版本与 Red Hat OpenShift Service on AWS 的版本对应。