4.2. 配置监控以使用 OpenShift 数据基础
OpenShift 数据基础提供由 Prometheus 和 Alert Manager 组成的监控堆栈。
按照本节中的说明,将 OpenShift 数据基础配置为监控堆栈的存储。
如果存储空间不足,则监控将无法正常工作。始终确保您拥有大量用于监控的存储容量。
红帽建议为此服务配置简短的保留间隔。详情请参阅 OpenShift Container Platform 文档中的 Prometheus 指标指南的修改保留时间。
先决条件
- 具有 OpenShift Web 控制台的管理访问权限。
-
OpenShift Data Foundation Operator 在
openshift-storage
命名空间上安装并运行。在 OpenShift Web 控制台中,点 OperatorsInstalled Operators 查看已安装的 Operator。 -
监控 Operator 在
openshift-monitoring
命名空间内安装并运行。在 OpenShift Web 控制台中,点 AdministrationCluster Settings Cluster Operators 查看集群操作器。 -
带有 provisioner
openshift-storage.rbd.csi.ceph.com
的存储类可用。在 OpenShift Web 控制台中,点 StorageStorageClasses 查看可用的存储类。
流程
-
在 OpenShift Web 控制台中,前往 Workloads
Config Maps。 -
将 Project 下拉菜单设置为
openshift-monitoring
。 - 单击 Create Config Map。
使用以下命令定义一个新的
cluster-monitoring-config
Config Map。将尖括号 (
<
,>
) 中的内容替换为您自己的值,如retention: 24h
或storage: 40Gi
。将 storageClassName 替换为使用 provisioner
openshift-storage.rbd.csi.ceph.com
的storageclass
。在下例中,storageclass 的名称为ocs-storagecluster-ceph-rbd
。cluster-monitoring-config
Config Map 示例apiVersion: v1 kind: ConfigMap metadata: name: cluster-monitoring-config namespace: openshift-monitoring data: config.yaml: | prometheusK8s: retention: <time to retain monitoring files, e.g. 24h> volumeClaimTemplate: metadata: name: ocs-prometheus-claim spec: storageClassName: ocs-storagecluster-ceph-rbd resources: requests: storage: <size of claim, e.g. 40Gi> alertmanagerMain: volumeClaimTemplate: metadata: name: ocs-alertmanager-claim spec: storageClassName: ocs-storagecluster-ceph-rbd resources: requests: storage: <size of claim, e.g. 40Gi>
- 单击 Create 以保存并创建 Config Map。
验证步骤
验证持久卷声明是否已绑定到 pod。
-
进入 Storage
Persistent Volume Claims。 -
将 Project 下拉菜单设置为
openshift-monitoring
。 验证 5 持久性卷声明是否可见,状态为
Bound
,附加到三个alertmanager-main-*
pod,以及两个prometheus-k8s-*
pod。图 4.1. 监控创建和绑定的存储
-
进入 Storage
验证新
alertmanager-main-*
pod 的状态是否显示为Running
。-
进入 Workloads
Pods。 -
点击新
alertmanager-main-*
pod 查看 pod 详情。 向下滚动到 Volumes,再验证卷是否具有 Type (
ocs-alertmanager-claim)
,它与您的新持久性卷声明匹配,如ocs-alertmanager-claim-alertmanager-main-0
。图 4.2. 附加到
alertmanager-main-*
pod 的持久性卷声明
-
进入 Workloads
验证新的
prometheus-k8s-*
pod 的状态是否为Running
。-
点新的
prometheus-k8s-*
Pod 查看 pod 详情。 向下滚动到 Volumes,再验证卷是否具有 Type (
ocs-prometheus-claim
),它与您的新持久性卷声明匹配,如ocs-prometheus-claim-prometheus-k8s-0
。图 4.3. 附加到
prometheus-k8s-*
pod 的持久性卷声明
-
点新的