1.2. Observability 配置
当启用 observability 服务时,hub 集群始终配置为收集并发送指标到配置的 Thanos 实例,无论是否启用 hub 自助管理。当 hub 集群是自我管理时,disableHubSelfManagement 参数设置为 false,这是默认设置。multiclusterhub-operator 默认启用 multicluster-observability-operator pod。您必须配置 multicluster-observability-operator pod。
hub 集群的指标和警报会出现在 local-cluster 命名空间中。只有启用了 hub 自助管理时,local-cluster 才可用。您可以在 Grafana explorer 中查询 local-cluster 指标。继续阅读以了解您可以使用可观察性组件收集的指标数据,以及可观察性 pod 容量的信息。
1.2.1. 指标类型 复制链接链接已复制到粘贴板!
默认情况下,OpenShift Container Platform 使用 Telemetry 服务向红帽发送指标数据。acm_managed_cluster_info 由 Red Hat Advanced Cluster Management 提供,包含在 Telemetry 中,但不会显示在 Red Hat Advanced Cluster Management Observe 环境概述 仪表板中。
查看框架支持的指标类型表:
| 指标名称 | 指标类型 | 标签/标签 | Status |
|---|---|---|---|
|
| 量表 |
| 稳定 |
|
| Histogram | None | 稳定。如需更多详细信息,请参阅监管指标。 |
|
| Histogram | None | 稳定。如需了解更多详细信息,请参阅监管指标。 |
|
| Histogram | None | 稳定。如需更多详细信息,请参阅监管指标。 |
|
| 量表 |
| 稳定。查看 监管指标 以了解更多详细信息。 |
|
| 量表 |
| 稳定。有关更多详细信息,请阅读管理 Insights _PolicyReports_。 |
|
| 计数 | None | 稳定。请参阅 控制台 文档中的 搜索组件 部分。 |
|
| Histogram | None | 稳定。请参阅 控制台 文档中的 搜索组件 部分。 |
|
| Histogram | None | 稳定。请参阅 控制台 文档中的 搜索组件 部分。 |
|
| 计数 | None | 稳定。请参阅 控制台 文档中的 搜索组件 部分。 |
|
| Histogram | None | 稳定。请参阅 控制台 文档中的 搜索组件 部分。 |
|
| 量表 | None | 稳定。请参阅 控制台 文档中的 搜索组件 部分。 |
|
| Histogram | None | 稳定。请参阅 控制台 文档中的 搜索组件 部分。 |
1.2.2. 默认指标 复制链接链接已复制到粘贴板!
要查看默认指标,请运行以下命令来查看 observability-metrics-allowlist :
oc -n open-cluster-management-observability get cm observability-metrics-allowlist -o yaml
oc -n open-cluster-management-observability get cm observability-metrics-allowlist -o yaml
注: 您无法更改允许列表中的默认指标。
1.2.3. Observability pod 容量请求 复制链接链接已复制到粘贴板!
Observability 组件需要 2701mCPU 和 11972Mi 内存来安装可观察性服务。下表是启用了 observability-addons 的五个受管集群的 pod 容量请求列表:
| Deployment 或 StatefulSet | 容器名称 | CPU(mCPU) | 内存(Mi) | Replicas | Pod 总计 CPU | Pod 内存总量 |
|---|---|---|---|---|---|---|
| observability-alertmanager | alertmanager | 4 | 200 | 3 | 12 | 600 |
| config-reloader | 4 | 25 | 3 | 12 | 75 | |
| alertmanager-proxy | 1 | 20 | 3 | 3 | 60 | |
| observability-grafana | grafana | 4 | 100 | 2 | 8 | 200 |
| grafana-dashboard-loader | 4 | 50 | 2 | 8 | 100 | |
| observability-observatorium-api | observatorium-api | 20 | 128 | 2 | 40 | 256 |
| observability-observatorium-operator | observatorium-operator | 100 | 100 | 1 | 10 | 50 |
| observability-rbac-query-proxy | rbac-query-proxy | 20 | 100 | 2 | 40 | 200 |
| oauth-proxy | 1 | 20 | 2 | 2 | 40 | |
| observability-thanos-compact | thanos-compact | 500 | 1024 | 1 | 100 | 512 |
| observability-thanos-query | thanos-query | 300 | 1024 | 2 | 600 | 2048 |
| observability-thanos-query-frontend | thanos-query-frontend | 100 | 256 | 2 | 200 | 512 |
| observability-thanos-query-frontend-memcached | memcached | 45 | 128 | 3 | 135 | 384 |
| exporter | 5 | 50 | 3 | 15 | 150 | |
| observability-thanos-receive-controller | thanos-receive-controller | 4 | 32 | 1 | 4 | 32 |
| observability-thanos-receive-default | thanos-receive | 300 | 512 | 3 | 900 | 1536 |
| observability-thanos-rule | thanos-rule | 50 | 512 | 3 | 150 | 1536 |
| configmap-reloader | 4 | 25 | 3 | 12 | 75 | |
| observability-thanos-store-memcached | memcached | 45 | 128 | 3 | 135 | 384 |
| exporter | 5 | 50 | 3 | 15 | 150 | |
| observability-thanos-store-shard | thanos-store | 100 | 1024 | 3 | 300 | 3072 |
1.2.4. 其他资源 复制链接链接已复制到粘贴板!
- 有关启用可观察性的更多信息 ,请参阅启用可观察性服务。
- 阅读 自定义可观察性,了解如何自定义可观察性服务、查看指标和其他数据。
- 使用 Grafana 仪表板读取。
- 从 OpenShift Container Platform 文档中了解使用遥测来收集并发送哪些指标类型。如需更多信息,请参阅 Telemetry 收集的信息。
- 详情请参阅监管指标。
- 请参阅 Prometheus 记录规则。
- 另请参阅 Prometheus 警报规则。