3.3. 使用仪表板查看和查找数据
通过从 hub 集群访问 Grafana 来查看来自受管集群的数据。您可以查询特定的警报并为查询添加过滤器。
例如,要从单节点 OpenShift 集群中探索 cluster_infrastructure_provider 警报,请使用以下查询表达式: cluster_infrastructure_provider{clusterType="SNO"}
注: 如果在单一节点受管集群中启用了可观察性,请不要设置 ObservabilitySpec.resources.CPU.limits 参数。当您设置 CPU 限制时,observability pod 会计算为受管集群的容量。请参阅附加资源部分中的管理工作负载分区。
3.3.1. 查看历史数据 复制链接链接已复制到粘贴板!
当您查询历史数据时,手动设置查询参数选项来控制仪表板中显示的数据量。完成以下步骤:
- 在 hub 集群中,选择位于控制台标头中的 Grafana 链接。
- 选择 Edit Panel 来编辑集群仪表板。
- 在 Grafana 中的 Query 前端数据源中点 Query 选项卡。
-
选择
$datasource。 - 如果要查看更多数据,请增加 Step 参数的值。如果 Step 参数部分为空,则会自动计算。
-
找到 Custom query parameters 字段,然后选择
max_source_resolution=auto。 - 要验证是否显示数据,请刷新 Grafana 页面。
您的查询数据会出现在 Grafana 仪表板中。
3.3.2. 查看 Red Hat Advanced Cluster Management 仪表板 复制链接链接已复制到粘贴板!
当您启用 Red Hat Advanced Cluster Management observability 服务时,有三个仪表板可用。以下仪表板描述:
- 警报分析 :受管集群中生成的警报的 Overview 仪表板。
- Cluster by Alert: Alert dashboard where can by the alert name.
- Cluster 警报 :警报仪表板,您可以在其中按集群过滤,并查看在集群环境中启动或待处理警报的实时数据。
3.3.3. 查看 etcd 表 复制链接链接已复制到粘贴板!
您还可以在 Grafana 中查看 hub 集群仪表板中的 etcd 表,以了解 etcd 的稳定性作为数据存储。从 hub 集群中选择 Grafana 链接来查看从 hub 集群收集的 etcd 表数据。此时会显示跨受管集群的领导选举更改。
3.3.4. 查看 Kubernetes API 服务器仪表板 复制链接链接已复制到粘贴板!
查看以下选项以查看 Kubernetes API 服务器仪表板:
在 Grafana 中的 hub 集群仪表板中查看集群 fleet Kubernetes API 服务级别概述。
- 进入 Grafana 仪表板。
选择 Kubernetes > Service-Level Overview > API Server 来访问受管仪表板菜单。此时会显示 Fleet Overview 和 Top Cluster 的详情。
在过去 7 或 30 天、关闭和非关闭集群以及 API 服务器请求持续时间内超过或满足 目标服务级别目标 (SLO)值的集群总数会显示。
在 Grafana 中的 hub 集群仪表板中查看 Kubernetes API 服务级别概述表。
- 从 hub 集群导航到 Grafana 仪表板。
选择 Kubernetes > Service-Level Overview > API Server 来访问受管仪表板菜单。此时会显示 Fleet Overview 和 Top Cluster 的详情。
在过去 7 或 30 天的错误预算显示,剩余的停机时间和趋势显示。