OpenShift Container Storage is now OpenShift Data Foundation starting with version 4.9.
第 4 章 监控 OpenShift Data Foundation 逻辑卷管理器 Operator
使用 OpenShift Web 控制台安装 OpenShift Data Foundation Logical Volume Manager Operator 时,您可以默认使用控制台中的 Block and File 仪表板来监控集群。但是,当您使用 RHACM 安装 OpenShift Data Foundation Logical Volume Manager Operator 时,您需要配置 RHACM Observability 以从一个位置监控所有 SNO 集群。
您可以通过在 RHACM 仪表板以及其触发的警告信息中查看 Operator 导出的指标来监控 OpenShift Data Foundation 逻辑卷管理器 Operator。按照 Observability 指南中所述启用 RHACM Observability。
- 指标
-
将以下
topolvmmetrics 添加到 allow 列表中,如添加自定义 metrics 部分所述:
topolvm_thinpool_data_percent topolvm_thinpool_metadata_percent topolvm_thinpool_size_bytes
topolvm_thinpool_data_percent topolvm_thinpool_metadata_percent topolvm_thinpool_size_bytesCopy to Clipboard Copied! Toggle word wrap Toggle overflow -
将以下
指标每 10 分钟更新一次,或者在 thin-pool 中有变化时(如新的逻辑卷创建)更新。
- 警报
- 当精简池和卷组都被用尽后,进一步的操作都会失败,并可能导致数据丢失。Logical Volume Manager Operator 发送以下警报使用精简池和卷组跨特定值:
| 警报 | 描述 |
|---|---|
| VolumeGroupUsageAtThresholdNearFull | 当卷组和精简池在节点上都达到 75% 时,会触发此警报。需要删除数据或卷组扩展。 |
| VolumeGroupUsageAtThresholdCritical | 当卷组和精简池超过 nodes.VolumeGroup 85% 时(严重满)触发此警报。需要删除数据或卷组扩展。 |
| ThinPoolDataUsageAtThresholdNearFull | 当卷组中的精简池数据利用率超过节点上的 75% 时,会触发此警报。需要删除数据或精简池扩展。 |
| ThinPoolDataUsageAtThresholdCritical | 当卷组中的精简池数据利用率超过节点上的 85% 时,会触发此警报。需要删除数据或精简池扩展。 |
| ThinPoolMetaDataUsageAtThresholdNearFull | 当卷组中的精简池元数据利用率超过节点上的 75% 时,会触发此警报。需要删除数据或精简池扩展。 |
| ThinPoolMetaDataUsageAtThresholdCritical | 当卷组中的精简池元数据利用率超过节点上的 85% 时,会触发此警报。需要删除数据或精简池扩展。 |