1.2. Observability 配置
当启用 observability 服务时,hub 集群始终配置为收集并发送指标到配置的 Thanos 实例,无论是否启用 hub 自助管理。当 hub 集群是自我管理时,disableHubSelfManagement
参数设置为 false
,这是默认设置。multiclusterhub-operator
默认启用 multicluster-observability-operator
pod。您必须配置 multicluster-observability-operator
pod。
hub 集群的指标和警报会出现在 local-cluster
命名空间中。只有启用了 hub 自助管理时,local-cluster
才可用。您可以在 Grafana explorer 中查询 local-cluster
指标。继续阅读以了解您可以使用可观察性组件收集的指标数据,以及可观察性 pod 容量的信息。
1.2.1. 指标类型
默认情况下,OpenShift Container Platform 使用 Telemetry 服务向红帽发送指标数据。acm_managed_cluster_info
由 Red Hat Advanced Cluster Management 提供,包含在 Telemetry 中,但不会显示在 Red Hat Advanced Cluster Management Observe 环境概述 仪表板中。
查看框架支持的指标类型表:
指标名称 | 指标类型 | 标签/标签 | Status |
---|---|---|---|
| 量表 |
| 稳定 |
| Histogram | None | 稳定。如需更多详细信息,请参阅监管指标。 |
| Histogram | None | 稳定。如需了解更多详细信息,请参阅监管指标。 |
| Histogram | None | 稳定。如需更多详细信息,请参阅监管指标。 |
| 量表 |
| 稳定。查看 监管指标 以了解更多详细信息。 |
| 量表 |
| 稳定。有关更多详细信息,请阅读管理 Insights _PolicyReports_。 |
| 计数 | None | 稳定。请参阅 控制台 文档中的 搜索组件 部分。 |
| Histogram | None | 稳定。请参阅 控制台 文档中的 搜索组件 部分。 |
| Histogram | None | 稳定。请参阅 控制台 文档中的 搜索组件 部分。 |
| 计数 | None | 稳定。请参阅 控制台 文档中的 搜索组件 部分。 |
| Histogram | None | 稳定。请参阅 控制台 文档中的 搜索组件 部分。 |
| 量表 | None | 稳定。请参阅 控制台 文档中的 搜索组件 部分。 |
| Histogram | None | 稳定。请参阅 控制台 文档中的 搜索组件 部分。 |
1.2.2. Observability pod 容量请求
Observability 组件需要 2701mCPU 和 11972Mi 内存来安装可观察性服务。下表是启用了 observability-addons
的五个受管集群的 pod 容量请求列表:
Deployment 或 StatefulSet | 容器名称 | CPU(mCPU) | 内存(Mi) | Replicas | Pod 总计 CPU | Pod 内存总量 |
---|---|---|---|---|---|---|
observability-alertmanager | alertmanager | 4 | 200 | 3 | 12 | 600 |
config-reloader | 4 | 25 | 3 | 12 | 75 | |
alertmanager-proxy | 1 | 20 | 3 | 3 | 60 | |
observability-grafana | grafana | 4 | 100 | 2 | 8 | 200 |
grafana-dashboard-loader | 4 | 50 | 2 | 8 | 100 | |
observability-observatorium-api | observatorium-api | 20 | 128 | 2 | 40 | 256 |
observability-observatorium-operator | observatorium-operator | 100 | 100 | 1 | 10 | 50 |
observability-rbac-query-proxy | rbac-query-proxy | 20 | 100 | 2 | 40 | 200 |
oauth-proxy | 1 | 20 | 2 | 2 | 40 | |
observability-thanos-compact | thanos-compact | 500 | 1024 | 1 | 100 | 512 |
observability-thanos-query | thanos-query | 300 | 1024 | 2 | 600 | 2048 |
observability-thanos-query-frontend | thanos-query-frontend | 100 | 256 | 2 | 200 | 512 |
observability-thanos-query-frontend-memcached | memcached | 45 | 128 | 3 | 135 | 384 |
exporter | 5 | 50 | 3 | 15 | 150 | |
observability-thanos-receive-controller | thanos-receive-controller | 4 | 32 | 1 | 4 | 32 |
observability-thanos-receive-default | thanos-receive | 300 | 512 | 3 | 900 | 1536 |
observability-thanos-rule | thanos-rule | 50 | 512 | 3 | 150 | 1536 |
configmap-reloader | 4 | 25 | 3 | 12 | 75 | |
observability-thanos-store-memcached | memcached | 45 | 128 | 3 | 135 | 384 |
exporter | 5 | 50 | 3 | 15 | 150 | |
observability-thanos-store-shard | thanos-store | 100 | 1024 | 3 | 300 | 3072 |
1.2.3. 其他资源
- 有关启用可观察性的更多信息 ,请参阅启用可观察性服务。
- 阅读 自定义可观察性,了解如何自定义可观察性服务、查看指标和其他数据。
- 使用 Grafana 仪表板读取。
- 从 OpenShift Container Platform 文档中了解使用遥测来收集并发送哪些指标类型。如需更多信息,请参阅 Telemetry 收集的信息。
- 详情请参阅监管指标。
- 请参阅 Prometheus 记录规则。
- 另请参阅 Prometheus 警报规则。