3.2.3.15. stale
虽然 Ceph 使用 heartbeats 来确保主机和守护进程正在运行,但 ceph-osd
守护进程也可能进入 stuck
状态,它们未及时报告统计数据,例如临时网络故障。默认情况下,OSD 守护进程每半秒报告其放置组、thru、引导和失败统计信息,即 0.5
,比心跳阈值更频繁。如果 PG 执行集合的 Primary OSD 无法报告给 monitor,或者其他 OSD 报告了Primary OSD down
,则 monitor 将标记 PG stale
。
当您启动存储集群时,通常会查看 stale
状态,直到对等过程完成为止。在存储集群运行一段时间后,查看处于 stale
状态的 PG 表示这些 PG 的 Primary OSD 为 down
或者没有向 monitor 报告 PG 统计信息。