1.2. Observability 配置


当启用 observability 服务时,hub 集群始终配置为收集并发送指标到配置的 Thanos 实例,无论是否启用 hub 自助管理。当 hub 集群是自我管理时,disableHubSelfManagement 参数设置为 false,这是默认设置。multiclusterhub-operator 默认启用 multicluster-observability-operator pod。您必须配置 multicluster-observability-operator pod。

hub 集群的指标和警报会出现在 local-cluster 命名空间中。只有启用了 hub 自助管理时,local-cluster 才可用。您可以在 Grafana explorer 中查询 local-cluster 指标。继续阅读以了解您可以使用可观察性组件收集的指标数据,以及可观察性 pod 容量的信息。

1.2.1. 指标类型

默认情况下,OpenShift Container Platform 使用 Telemetry 服务向红帽发送指标数据。acm_managed_cluster_info 由 Red Hat Advanced Cluster Management 提供,包含在 Telemetry 中,但不会显示在 Red Hat Advanced Cluster Management Observe 环境概述 仪表板中。

查看框架支持的指标类型表:

表 1.3. 参数表
指标名称指标类型标签/标签Status

acm_managed_cluster_info

量表

hub_cluster_id, managed_cluster_id, vendor, cloud, version, available, created_via, core_worker, socket_worker

稳定

config_policies_evaluation_duration_seconds_bucket

Histogram

None

稳定。如需更多详细信息,请参阅监管指标

config_policies_evaluation_duration_seconds_count

Histogram

None

稳定。如需了解更多详细信息,请参阅监管指标

config_policies_evaluation_duration_seconds_sum

Histogram

None

稳定。如需更多详细信息,请参阅监管指标

policy_governance_info

量表

type, policy, policy_namespace, cluster_namespace

稳定。查看 监管指标 以了解更多详细信息。

policyreport_info

量表

managed_cluster_id, category, policy, result, severity

稳定。有关更多详细信息,请阅读管理 Insights _PolicyReports_

search_api_db_connection_failed_total

计数

None

稳定。请参阅 控制台 文档中的 搜索组件 部分。

search_api_dbquery_duration_seconds

Histogram

None

稳定。请参阅 控制台 文档中的 搜索组件 部分。

search_api_requests

Histogram

None

稳定。请参阅 控制台 文档中的 搜索组件 部分。

search_indexer_request_count

计数

None

稳定。请参阅 控制台 文档中的 搜索组件 部分。

search_indexer_request_duration

Histogram

None

稳定。请参阅 控制台 文档中的 搜索组件 部分。

search_indexer_requests_in_flight

量表

None

稳定。请参阅 控制台 文档中的 搜索组件 部分。

search_indexer_request_size

Histogram

None

稳定。请参阅 控制台 文档中的 搜索组件 部分。

1.2.2. Observability pod 容量请求

Observability 组件需要 2701mCPU 和 11972Mi 内存来安装可观察性服务。下表是启用了 observability-addons 的五个受管集群的 pod 容量请求列表:

表 1.4. Observability pod 容量请求
Deployment 或 StatefulSet容器名称CPU(mCPU)内存(Mi)ReplicasPod 总计 CPUPod 内存总量

observability-alertmanager

alertmanager

4

200

3

12

600

config-reloader

4

25

3

12

75

alertmanager-proxy

1

20

3

3

60

observability-grafana

grafana

4

100

2

8

200

grafana-dashboard-loader

4

50

2

8

100

observability-observatorium-api

observatorium-api

20

128

2

40

256

observability-observatorium-operator

observatorium-operator

100

100

1

10

50

observability-rbac-query-proxy

rbac-query-proxy

20

100

2

40

200

oauth-proxy

1

20

2

2

40

observability-thanos-compact

thanos-compact

500

1024

1

100

512

observability-thanos-query

thanos-query

300

1024

2

600

2048

observability-thanos-query-frontend

thanos-query-frontend

100

256

2

200

512

observability-thanos-query-frontend-memcached

memcached

45

128

3

135

384

exporter

5

50

3

15

150

observability-thanos-receive-controller

thanos-receive-controller

4

32

1

4

32

observability-thanos-receive-default

thanos-receive

300

512

3

900

1536

observability-thanos-rule

thanos-rule

50

512

3

150

1536

configmap-reloader

4

25

3

12

75

observability-thanos-store-memcached

memcached

45

128

3

135

384

exporter

5

50

3

15

150

observability-thanos-store-shard

thanos-store

100

1024

3

300

3072

1.2.3. 其他资源

Red Hat logoGithubRedditYoutubeTwitter

学习

尝试、购买和销售

社区

关于红帽文档

通过我们的产品和服务,以及可以信赖的内容,帮助红帽用户创新并实现他们的目标。

让开源更具包容性

红帽致力于替换我们的代码、文档和 Web 属性中存在问题的语言。欲了解更多详情,请参阅红帽博客.

關於紅帽

我们提供强化的解决方案,使企业能够更轻松地跨平台和环境(从核心数据中心到网络边缘)工作。

© 2024 Red Hat, Inc.