第 1 章 初始故障排除
本章包含以下内容的信息:
- 如何启动 Ceph 错误故障排除(第 1.1 节 “识别问题”)
-
大多数常见的
ceph health
错误消息(第 1.2 节 “了解ceph health
命令的输出”) - 大多数常见的 Ceph 日志错误消息(第 1.3 节 “了解 Ceph 日志”)
1.1. 识别问题
要确定遇到的 Red Hat Ceph Storage 出错的原因,请回答以下问题:
- 使用不受支持的配置时可能会产生某些问题。确保您的配置被支持。详情请参阅 Red Hat Ceph Storage: 支持的配置 文章。
您知道哪个 Ceph 组件导致了此问题吗?
- 否。后跟 第 1.1.1 节 “诊断 Ceph 存储集群的健康状况”。
- 监视器.请参阅 第 4 章 监控器故障排除。
- OSD.请参阅 第 5 章 OSD 故障排除。
- 放置组.请参阅 第 7 章 PG 故障排除。
1.1.1. 诊断 Ceph 存储集群的健康状况
此流程列出了诊断 Ceph 存储集群健康状况的基本步骤。
检查集群的整体状态:
# ceph health detail
如果命令返回
HEALTH_WARN
或HEALTH_ERR
,详情请参阅 第 1.2 节 “了解ceph health
命令的输出”。-
检查 Ceph 日志中是否列出 第 1.3 节 “了解 Ceph 日志” 中列出的任何错误消息。日志默认位于
/var/log/ceph/
目录中。 - 如果日志没有包含足够数量的信息,提高调试级别并尝试重现失败的操作。详情请查看 第 2 章 配置日志记录。
-
使用
ceph-medic
实用程序诊断存储集群。如需了解更多详细信息 ,请参阅《红帽 Ceph 存储 3 管理指南》的使用ceph-medic
诊断 Ceph 存储集群 部分。