7.2. 在 Hub 集群上启用灾难恢复仪表板
本节介绍了为 Hub 集群上的高级监控启用灾难恢复仪表板。
对于 Regional-DR,仪表板会显示 operator 健康、集群健康状况、指标、警报和应用程序计数的监控状态卡。
对于 Metro-DR,您可以将仪表板配置为仅监控ramen 设置健康状况和应用程序计数。
先决条件
确保您已安装了以下内容
- OpenShift Container Platform 版本 4.17 并具有管理员特权。
- 启用控制台插件的 ODF Multicluster Orchestrator。
- 来自 Operator Hub 的 Red Hat Advanced Cluster Management for Kubernetes 2.11 (RHACM)。有关如何安装的步骤,请参阅安装 RHACM。
- 确保您已在 RHACM 上启用了可观察性。请参阅 启用可观察性指南。
流程
- 在 Hub 集群中,打开终端窗口并执行后续步骤。
创建名为
observability-metrics-custom-allowlist.yaml的 configmap 文件。您可以使用以下 YAML 列出 Hub 集群上的灾难恢复指标。详情请参阅 添加自定义指标。要了解有关 ramen 指标的更多信息,请参阅 灾难恢复指标。
kind: ConfigMap apiVersion: v1 metadata: name: observability-metrics-custom-allowlist namespace: open-cluster-management-observability data: metrics_list.yaml: | names: - ceph_rbd_mirror_snapshot_sync_bytes - ceph_rbd_mirror_snapshot_snapshots matches: - __name__="csv_succeeded",exported_namespace="openshift-dr-system",name=~"odr-cluster-operator.*" - __name__="csv_succeeded",exported_namespace="openshift-operators",name=~"volsync.*"在
open-cluster-management-observability命名空间中运行以下命令:$ oc apply -n open-cluster-management-observability -f observability-metrics-custom-allowlist.yaml创建
observability-metrics-custom-allowlistyaml 后,RHACM 开始从所有受管集群收集列出的 OpenShift Data Foundation 指标。要排除特定的受管集群收集可观察性数据,请在集群中添加以下集群标签:
observability: disabled。