1.2. 了解 ceph health 命令的输出


ceph health 命令返回有关 Ceph 存储集群状态的信息:

  • HEALTH_OK 表示集群处于健康状态。
  • HEALTH_WARN 表示警告。在某些情况下,Ceph 状态会自动返回到 HEALTH_OK,例如当 Ceph 完成重新平衡过程时。但是,如果集群处于 HEALTH_WARN 状态较长,请考虑进一步排除故障。
  • HEALTH_ERR 表示需要您立即关注的更严重问题。

使用 ceph health detailceph -s 命令获取更详细的输出。

下表列出了与 monitor、OSD 和 PG 相关的最常见 HEALTH_ERRHEALTH_WARN 错误消息。这些表中提供了相应的部分的链接,这些部分解释了错误并指向修复问题的特定程序。

表 1.1. 与 monitor 相关的错误消息
错误消息请查看

HEALTH_WARN

mon.X is down (out of quorum)

第 4.1.1 节 “Quorum 以外的 monitor”

clock skew

第 4.1.2 节 “时钟偏移”

store is getting too big!

第 4.1.3 节 “monitor 存储正在获取 Too Big”

表 1.2. 与 Ceph 管理器守护进程相关的错误消息
错误消息请查看

HEALTH_WARN

unknown pgs

为 Ceph Manager 打开端口

表 1.3. 与 OSD 相关的错误消息
错误消息请查看

HEALTH_ERR

full osds

第 5.1.1 节 “完整 OSD”

HEALTH_WARN

nearfull osds

第 5.1.2 节 “nearfull OSD”

osds are down

第 5.1.3 节 “个或更多 OSD 发生故障”

第 5.1.4 节 “Flapping OSD”

requests are blocked

第 5.1.5 节 “请求速度较慢,请求被阻塞”

slow requests

第 5.1.5 节 “请求速度较慢,请求被阻塞”

表 1.4. 与 PG 相关的错误消息
错误消息请查看

HEALTH_ERR

pgs down

第 7.1.5 节 “放置组 Are down

pgs inconsistent

第 7.1.2 节 “放置组不一致”

scrub errors

第 7.1.2 节 “放置组不一致”

HEALTH_WARN

pgs stale

第 7.1.1 节 “过时的 PG”

unfound

第 7.1.6 节 “未找到的对象”

Red Hat logoGithubRedditYoutubeTwitter

学习

尝试、购买和销售

社区

关于红帽文档

通过我们的产品和服务,以及可以信赖的内容,帮助红帽用户创新并实现他们的目标。

让开源更具包容性

红帽致力于替换我们的代码、文档和 Web 属性中存在问题的语言。欲了解更多详情,请参阅红帽博客.

關於紅帽

我们提供强化的解决方案,使企业能够更轻松地跨平台和环境(从核心数据中心到网络边缘)工作。

© 2024 Red Hat, Inc.