4.4. 替换失败的 monitor
当 monitor 具有损坏的存储时,建议通过利用 Ansible 自动化应用来替换 monitor。
先决条件
- 一个正在运行的 Red Hat Ceph Storage 集群。
- 能够形成仲裁.
- Ceph 监控节点的根级别访问权限.
流程
从 monitor 主机,默认删除位于
/var/lib/ceph/mon/CLUSTER_NAME -SHORT_HOST_NAME
的 monitor 存储:rm -rf /var/lib/ceph/mon/CLUSTER_NAME-SHORT_HOST_NAME
指定 monitor 主机的简短主机名和集群名称。例如,要从名为
remote
的集群中删除在host1
上运行的 monitor 存储:[root@mon ~]# rm -rf /var/lib/ceph/mon/remote-host1
从 monitor map 中删除 monitor(
monmap
):ceph mon remove SHORT_HOST_NAME --cluster CLUSTER_NAME
指定 monitor 主机的简短主机名和集群名称。例如,要从名为
remote
的集群中移除host1
上运行的 monitor:[root@mon ~]# ceph mon remove host1 --cluster remote
- 排除故障并修复与 monitor 主机底层文件系统或硬件相关的问题。
从 Ansible 管理节点,通过运行
ceph-ansible
playbook 来重新部署 monitor:$ /usr/share/ceph-ansible/ansible-playbook site.yml
其它资源
- 有关详细信息,请参阅 Ceph monitor 超出 仲裁数。
- 《 红帽 Ceph 存储操作指南》中的管理集群大小 一章。
- 《红帽 Ceph 存储 4 安装指南》中的部署红帽 Ceph 存储 章节.