4.2. 配置监控以使用 OpenShift 数据基础

OpenShift 数据基础提供由 Prometheus 和 Alert Manager 组成的监控堆栈。

按照本节中的说明，将 OpenShift 数据基础配置为监控堆栈的存储。

重要

如果存储空间不足，则监控将无法正常工作。始终确保您拥有大量用于监控的存储容量。

红帽建议为此服务配置简短的保留间隔。详情请参阅 OpenShift Container Platform 文档中的 Prometheus 指标指南的修改保留时间。

先决条件

具有 OpenShift Web 控制台的管理访问权限。
OpenShift Data Foundation Operator 在 openshift-storage 命名空间上安装并运行。在 OpenShift Web 控制台中，点 Operators Installed Operators 查看已安装的 Operator。
监控 Operator 在 openshift-monitoring 命名空间内安装并运行。在 OpenShift Web 控制台中，点 Administration Cluster Settings Cluster Operators 查看集群操作器。
带有 provisioner openshift-storage.rbd.csi.ceph.com 的存储类可用。在 OpenShift Web 控制台中，点 Storage StorageClasses 查看可用的存储类。

流程

在 OpenShift Web 控制台中，前往 Workloads Config Maps。
将 Project 下拉菜单设置为 openshift-monitoring。
单击 Create Config Map。

使用以下命令定义一个新的 cluster-monitoring-config Config Map。

将尖括号 (<, >) 中的内容替换为您自己的值，如 retention: 24h 或 storage: 40Gi。

将 storageClassName 替换为使用 provisioner openshift-storage.rbd.csi.ceph.com 的 storageclass。在下例中，storageclass 的名称为 ocs-storagecluster-ceph-rbd。

cluster-monitoring-config Config Map 示例

apiVersion: v1
kind: ConfigMap
metadata:
  name: cluster-monitoring-config
  namespace: openshift-monitoring
data:
  config.yaml: |
      prometheusK8s:
        retention: <time to retain monitoring files, e.g. 24h>
        volumeClaimTemplate:
          metadata:
            name: ocs-prometheus-claim
          spec:
            storageClassName: ocs-storagecluster-ceph-rbd
            resources:
              requests:
                storage: <size of claim, e.g. 40Gi>
      alertmanagerMain:
        volumeClaimTemplate:
          metadata:
            name: ocs-alertmanager-claim
          spec:
            storageClassName: ocs-storagecluster-ceph-rbd
            resources:
              requests:
                storage: <size of claim, e.g. 40Gi>

单击 Create 以保存并创建 Config Map。

验证步骤

验证持久卷声明是否已绑定到 pod。
1. 进入 Storage Persistent Volume Claims。
2. 将 Project 下拉菜单设置为 openshift-monitoring。
3. 验证 5 持久性卷声明是否可见，状态为 Bound，附加到三个 alertmanager-main-* pod，以及两个 prometheus-k8s-* pod。
  图 4.1. 监控创建和绑定的存储
验证新 alertmanager-main-* pod 的状态是否显示为 Running。
1. 进入 Workloads Pods。
2. 点击新 alertmanager-main-* pod 查看 pod 详情。
3. 向下滚动到 Volumes，再验证卷是否具有 Type (ocs-alertmanager-claim)，它与您的新持久性卷声明匹配，如 ocs-alertmanager-claim-alertmanager-main-0。
  图 4.2. 附加到 alertmanager-main-* pod 的持久性卷声明
验证新的 prometheus-k8s-* pod 的状态是否为 Running。
1. 点新的 prometheus-k8s-* Pod 查看 pod 详情。
2. 向下滚动到 Volumes，再验证卷是否具有 Type (ocs-prometheus-claim )，它与您的新持久性卷声明匹配，如 ocs-prometheus-claim-prometheus-k8s-0。
  图 4.3. 附加到 prometheus-k8s-* pod 的持久性卷声明