7.4. 将 OSD 报告为 down
默认情况下,来自不同主机的两个 Ceph OSD 守护进程必须报告给另一个 Ceph OSD 守护进程处于 down
状态的 Ceph 监控器,然后确认报告的 Ceph OSD 守护进程为 down
。
但是,所有 OSD 报告失败的可能性都位于具有错误交换机的机架中,导致 OSD 之间的连接问题。
为避免"错误警报",Ceph 会将故障报告为类似 lagy 的"subcluster"的代理。虽然情况并非总是如此,但可能帮助管理员对性能不良的系统子集进行本地化处理。
Ceph 使用 mon_osd_reporter_subtree_level
设置,将 peer 分到"cluster"的常用级别类型。
默认情况下,仅需要两个来自不同子树的报告,才能报告另一个 Ceph OSD 守护进程为 down
。管理员可以通过在 Ceph 的配置文件的 [mon]
部分下添加 mon_osd_min_down_reporters
和 mon_osd_reporter_subtree_level
设置,或在运行时指定值,修改报告一个 Ceph OSD Daemon 为 down
所需的来自唯一子树的报告者的数量以及通用祖先类型。
![报告故障 OSD](https://access.redhat.com/webassets/avalon/d/Red_Hat_Ceph_Storage-4-Configuration_Guide-zh-CN/images/9451e258fe1b73210968686f99ebed8c/110_Ceph_Configuration_updates_0720_05.png)