7.4. 将 OSD 报告为 down
默认情况下,来自不同主机的两个 Ceph OSD 守护进程必须报告给另一个 Ceph OSD 守护进程处于 down
状态的 Ceph 监控器,然后确认报告的 Ceph OSD 守护进程为 down
。
但是,所有 OSD 报告失败的可能性都位于具有错误交换机的机架中,导致 OSD 之间的连接问题。
为避免"错误警报",Ceph 会将故障报告为类似 lagy 的"subcluster"的代理。虽然情况并非总是如此,但可能帮助管理员对性能不良的系统子集进行本地化处理。
Ceph 使用 mon_osd_reporter_subtree_level
设置,将 peer 分到"cluster"的常用级别类型。
默认情况下,仅需要两个来自不同子树的报告,才能报告另一个 Ceph OSD 守护进程为 down
。管理员可以通过在运行时设置 mon_osd_min_down_reporters
和 mon_osd_reporter_subtree_level
的值,修改报告者的数量,将用于报告一个 Ceph OSD Daemon down
所需的唯一的子树和祖先类型改为 Ceph Monitor:
语法
ceph config set mon mon_osd_min_down_reporters NUMBER
示例
[ceph: root@host01 /]# ceph config set mon mon_osd_min_down_reporters 4
语法
ceph config set mon mon_osd_reporter_subtree_level CRUSH_ITEM
示例
[ceph: root@host01 /]# ceph config set mon mon_osd_reporter_subtree_level host [ceph: root@host01 /]# ceph config set mon mon_osd_reporter_subtree_level rack [ceph: root@host01 /]# ceph config set mon mon_osd_reporter_subtree_level osd