6.2. 在 Hub 集群上启用灾难恢复仪表板
本节介绍了在 Hub 集群上为高级监控启用灾难恢复仪表板。
对于 Regional-DR,仪表板会显示 operator 健康、集群运行状况、指标、警报和应用程序计数的监控状态卡。
对于 Metro-DR,您可以将仪表板配置为仅监控帧设置健康和应用程序计数。
先决条件
确保已安装以下内容
- OpenShift Container Platform 版本 4.15 并具有管理员特权。
- 启用控制台插件的 ODF Multicluster Orchestrator。
- 来自 Operator Hub 的 Red Hat Advanced Cluster Management for Kubernetes 2.10 (RHACM)。有关如何安装的步骤,请参阅安装 RHACM。
- 确保已在 RHACM 上启用了可观察性。请参阅 启用可观察性指南。
流程
- 在 Hub 集群中,打开终端窗口并执行以下步骤。
创建名为
observability-metrics-custom-allowlist.yaml
的 configmap 文件。您可以使用以下 YAML 列出 Hub 集群上的灾难恢复指标。详情请参阅 添加自定义指标。要了解有关帧指标的更多信息,请参阅 灾难恢复指标。
kind: ConfigMap apiVersion: v1 metadata: name: observability-metrics-custom-allowlist namespace: open-cluster-management-observability data: metrics_list.yaml: | names: - ceph_rbd_mirror_snapshot_sync_bytes - ceph_rbd_mirror_snapshot_snapshots matches: - __name__="csv_succeeded",exported_namespace="openshift-dr-system",name=~"odr-cluster-operator.*" - __name__="csv_succeeded",exported_namespace="openshift-operators",name=~"volsync.*"
在
open-cluster-management-observability
命名空间中运行以下命令:$ oc apply -n open-cluster-management-observability -f observability-metrics-custom-allowlist.yaml
创建
observability-metrics-custom-allowlist
yaml 后,RHACM 将开始从所有受管集群收集列出的 OpenShift Data Foundation 指标。要排除特定受管集群来收集可观察性数据,请在集群中添加以下集群标签
clusters: observability: disabled
。