7.2. 解决集群健康问题
Red Hat Ceph Storage 集群可以引发在 OpenShift Data Foundation 用户界面中显示的一组有限健康消息。它们定义为具有唯一标识符的健康检查。标识符是一个伪可读字符串,旨在使工具能够了解健康检查,并以反应其含义的方式呈现它们。如需更多信息和故障排除,请单击下面的健康代码。
健康代码 | 描述 |
---|---|
一个或多个 Ceph 监控器在磁盘空间上较低。 |
7.2.1. MON_DISK_LOW 复制链接链接已复制到粘贴板!
复制链接链接已复制到粘贴板!
如果将 monitor 数据库存储为百分比的文件系统中的可用空间下降到 mon_data_avail_warn
下,则会触发此警报(默认值:15%)。这可能表示系统上的其他进程或用户正在填满监控器使用的相同文件系统。它还可能表明 monitor 的数据库比较大。
注意
文件系统的路径因您的 mon 部署而异。您可以找到在 storagecluster.yaml
中部署 mon 的路径。
路径示例:
-
通过 PVC 路径部署的 mon:
/var/lib/ceph/mon
-
通过 hostpath 部署 mon:
/var/lib/rook/mon
要清除空间,请查看文件系统中高的使用文件,并选择要删除的文件。要查看文件,请运行:
du -a <path-in-the-mon-node> |sort -n -r |head -n10
# du -a <path-in-the-mon-node> |sort -n -r |head -n10
将 <path-in-the-mon-node
> 替换为部署 mons 的文件系统的路径。