第 9 章 在扩展模式下对集群进行故障排除
您可以替换和移除失败的 tiebreaker monitor。您还可以强制集群进入恢复或健康模式。
9.1. 使用仲裁中的 monitor 替换 tiebreaker 复制链接链接已复制到粘贴板!
如果您的 tiebreaker monitor 失败,您可以将其替换为仲裁中的现有 monitor,并将它从集群中移除。
先决条件
- 正在运行的 Red Hat Ceph Storage 集群
- 在集群中启用扩展模式
流程
禁用自动监控器部署:
示例
[ceph: root@host01 /]# ceph orch apply mon --unmanaged Scheduled mon update…
[ceph: root@host01 /]# ceph orch apply mon --unmanaged Scheduled mon update…
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 查看仲裁中的监控器:
示例
[ceph: root@host01 /]# ceph -s mon: 5 daemons, quorum host01, host02, host04, host05 (age 30s), out of quorum: host07
[ceph: root@host01 /]# ceph -s mon: 5 daemons, quorum host01, host02, host04, host05 (age 30s), out of quorum: host07
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 将仲裁中的监控器设置为一个新的 tiebreaker:
语法
ceph mon set_new_tiebreaker NEW_HOST
ceph mon set_new_tiebreaker NEW_HOST
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 示例
[ceph: root@host01 /]# ceph mon set_new_tiebreaker host02
[ceph: root@host01 /]# ceph mon set_new_tiebreaker host02
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 重要如果 monitor 与现有非tiebreaker 监视器位于同一个位置,您会收到错误消息:
示例
[ceph: root@host01 /]# ceph mon set_new_tiebreaker host02 Error EINVAL: mon.host02 has location DC1, which matches mons host02 on the datacenter dividing bucket for stretch mode.
[ceph: root@host01 /]# ceph mon set_new_tiebreaker host02 Error EINVAL: mon.host02 has location DC1, which matches mons host02 on the datacenter dividing bucket for stretch mode.
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 如果发生这种情况,请更改 monitor 的位置:
语法
ceph mon set_location HOST datacenter=DATACENTER
ceph mon set_location HOST datacenter=DATACENTER
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 示例
[ceph: root@host01 /]# ceph mon set_location host02 datacenter=DC3
[ceph: root@host01 /]# ceph mon set_location host02 datacenter=DC3
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 删除失败的 tiebreaker 监控器:
语法
ceph orch daemon rm FAILED_TIEBREAKER_MONITOR --force
ceph orch daemon rm FAILED_TIEBREAKER_MONITOR --force
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 示例
[ceph: root@host01 /]# ceph orch daemon rm mon.host07 --force Removed mon.host07 from host 'host07'
[ceph: root@host01 /]# ceph orch daemon rm mon.host07 --force Removed mon.host07 from host 'host07'
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 从主机中删除 monitor 后,重新部署 monitor:
语法
ceph mon add HOST IP_ADDRESS datacenter=DATACENTER ceph orch daemon add mon HOST
ceph mon add HOST IP_ADDRESS datacenter=DATACENTER ceph orch daemon add mon HOST
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 示例
[ceph: root@host01 /]# ceph mon add host07 213.222.226.50 datacenter=DC1 [ceph: root@host01 /]# ceph orch daemon add mon host07
[ceph: root@host01 /]# ceph mon add host07 213.222.226.50 datacenter=DC1 [ceph: root@host01 /]# ceph orch daemon add mon host07
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 确保仲裁中有五个监控器:
示例
[ceph: root@host01 /]# ceph -s mon: 5 daemons, quorum host01, host02, host04, host05, host07 (age 15s)
[ceph: root@host01 /]# ceph -s mon: 5 daemons, quorum host01, host02, host04, host05, host07 (age 15s)
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 验证一切是否已正确配置:
示例
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 重新部署 monitor:
语法
ceph orch apply mon --placement="HOST_1, HOST_2, HOST_3, HOST_4, HOST_5”
ceph orch apply mon --placement="HOST_1, HOST_2, HOST_3, HOST_4, HOST_5”
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 示例
[ceph: root@host01 /]# ceph orch apply mon --placement="host01, host02, host04, host05, host07" Scheduled mon update...
[ceph: root@host01 /]# ceph orch apply mon --placement="host01, host02, host04, host05, host07" Scheduled mon update...
Copy to Clipboard Copied! Toggle word wrap Toggle overflow