11.2. 删除 Ceph Monitor 守护进程
如果您的 Controller 节点正在运行 Ceph 监控服务,请完成以下步骤以删除 ceph-mon 守护进程。
在集群中添加新的 Controller 节点,也会自动添加新的 Ceph 监控器守护进程。
如果使用 Director 部署的 Red Hat Ceph Storage,了解替换 Controller 节点的影响非常重要。Ceph 监控服务在 Controller 节点上运行,通常是从存储网络分配 IP 地址。这些 Ceph 监控服务 IP 地址与使用 Red Hat Ceph Storage 的虚拟机实例关联。如果在替换 Controller 节点的过程中 Ceph Monitor 服务 IP 地址发生变化,则不会动态更新它们。这可能会导致存储中断,特别是当替换多个 Controller 节点时。每个虚拟机实例都必须迁移、重启或取消封锁,才能解决 IP 地址更改和导致的中断。
重复使用已删除 Ceph Monitor 服务实例的 IP 地址,而不是使用新的 IP 地址可避免这种情况。
例如,请参阅 overcloud 置备裸机节点的 第 5 步中的 fixed_ip 配置示例。
在 Controller 节点上使用以下内容查找当前的 Ceph Monitor 服务 IP 地址:
sudo cephadm shell -- ceph mon stat
$ sudo cephadm shell -- ceph mon stat
流程
连接到要替换的 Controller 节点:
ssh tripleo-admin@192.168.0.47
$ ssh tripleo-admin@192.168.0.47Copy to Clipboard Copied! Toggle word wrap Toggle overflow 列出 Ceph mon 服务:
sudo systemctl --type=service | grep ceph
$ sudo systemctl --type=service | grep ceph ceph-4cf401f9-dd4c-5cda-9f0a-fa47fbf12b31@crash.controller-0.service loaded active running Ceph crash.controller-0 for 4cf401f9-dd4c-5cda-9f0a-fa47fbf12b31 ceph-4cf401f9-dd4c-5cda-9f0a-fa47fbf12b31@mgr.controller-0.mufglq.service loaded active running Ceph mgr.controller-0.mufglq for 4cf401f9-dd4c-5cda-9f0a-fa47fbf12b31 ceph-4cf401f9-dd4c-5cda-9f0a-fa47fbf12b31@mon.controller-0.service loaded active running Ceph mon.controller-0 for 4cf401f9-dd4c-5cda-9f0a-fa47fbf12b31 ceph-4cf401f9-dd4c-5cda-9f0a-fa47fbf12b31@rgw.rgw.controller-0.ikaevh.service loaded active running Ceph rgw.rgw.controller-0.ikaevh for 4cf401f9-dd4c-5cda-9f0a-fa47fbf12b31Copy to Clipboard Copied! Toggle word wrap Toggle overflow 停止 Ceph mon 服务:
sudo systemtctl stop ceph-4cf401f9-dd4c-5cda-9f0a-fa47fbf12b31@mon.controller-0.service
$ sudo systemtctl stop ceph-4cf401f9-dd4c-5cda-9f0a-fa47fbf12b31@mon.controller-0.serviceCopy to Clipboard Copied! Toggle word wrap Toggle overflow 禁用 Ceph mon 服务:
sudo systemctl disable ceph-4cf401f9-dd4c-5cda-9f0a-fa47fbf12b31@mon.controller-0.service
$ sudo systemctl disable ceph-4cf401f9-dd4c-5cda-9f0a-fa47fbf12b31@mon.controller-0.serviceCopy to Clipboard Copied! Toggle word wrap Toggle overflow - 从要替换的 Controller 节点断开连接。
使用 SSH 连接到同一集群中的另一 Controller 节点:
ssh tripleo-admin@192.168.0.46
$ ssh tripleo-admin@192.168.0.46Copy to Clipboard Copied! Toggle word wrap Toggle overflow 在此过程中修改并应用 Ceph 规格文件,以操作您必须导出该文件:
sudo cephadm shell -- ceph orch ls --export > spec.yaml
$ sudo cephadm shell -- ceph orch ls --export > spec.yamlCopy to Clipboard Copied! Toggle word wrap Toggle overflow 从集群中删除该监控器:
sudo cephadm shell -- ceph mon remove controller-0
$ sudo cephadm shell -- ceph mon remove controller-0 removing mon.controller-0 at [v2:172.23.3.153:3300/0,v1:172.23.3.153:6789/0], there will be 2 monitorsCopy to Clipboard Copied! Toggle word wrap Toggle overflow 从 Controller 节点断开连接,再重新登录到您要从集群中删除的 Controller 节点:
ssh tripleo-admin@192.168.0.47
$ ssh tripleo-admin@192.168.0.47Copy to Clipboard Copied! Toggle word wrap Toggle overflow 列出 Ceph mgr 服务:
sudo systemctl --type=service | grep ceph
$ sudo systemctl --type=service | grep ceph ceph-4cf401f9-dd4c-5cda-9f0a-fa47fbf12b31@crash.controller-0.service loaded active running Ceph crash.controller-0 for 4cf401f9-dd4c-5cda-9f0a-fa47fbf12b31 ceph-4cf401f9-dd4c-5cda-9f0a-fa47fbf12b31@mgr.controller-0.mufglq.service loaded active running Ceph mgr.controller-0.mufglq for 4cf401f9-dd4c-5cda-9f0a-fa47fbf12b31 ceph-4cf401f9-dd4c-5cda-9f0a-fa47fbf12b31@rgw.rgw.controller-0.ikaevh.service loaded active running Ceph rgw.rgw.controller-0.ikaevh for 4cf401f9-dd4c-5cda-9f0a-fa47fbf12b31Copy to Clipboard Copied! Toggle word wrap Toggle overflow 停止 Ceph mgr 服务:
sudo systemctl stop ceph-4cf401f9-dd4c-5cda-9f0a-fa47fbf12b31@mgr.controller-0.mufglq.service
$ sudo systemctl stop ceph-4cf401f9-dd4c-5cda-9f0a-fa47fbf12b31@mgr.controller-0.mufglq.serviceCopy to Clipboard Copied! Toggle word wrap Toggle overflow 禁用 Ceph mgr 服务:
sudo systemctl disable ceph-4cf401f9-dd4c-5cda-9f0a-fa47fbf12b31@mgr.controller-0.mufglq.service
$ sudo systemctl disable ceph-4cf401f9-dd4c-5cda-9f0a-fa47fbf12b31@mgr.controller-0.mufglq.serviceCopy to Clipboard Copied! Toggle word wrap Toggle overflow 启动
cephadmshell:sudo cephadm shell
$ sudo cephadm shellCopy to Clipboard Copied! Toggle word wrap Toggle overflow 验证 Controller 节点的 Ceph mgr 服务是否已从集群中移除:
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 如果 Ceph mgr 服务被成功移除,则节点不会被列出。
导出 Red Hat Ceph Storage 规格:
ceph orch ls --export > spec.yaml
$ ceph orch ls --export > spec.yamlCopy to Clipboard Copied! Toggle word wrap Toggle overflow -
在
spec.yaml规范文件中,从service_type: mon和service_type: mgr中删除主机的所有实例,如controller-0。 重新应用 Red Hat Ceph Storage 规格:
ceph orch apply -i spec.yaml
$ ceph orch apply -i spec.yamlCopy to Clipboard Copied! Toggle word wrap Toggle overflow 验证删除的主机上没有保留 Ceph 守护进程:
ceph orch ps controller-0
$ ceph orch ps controller-0Copy to Clipboard Copied! Toggle word wrap Toggle overflow 注意如果存在守护进程,使用以下命令删除它们:
ceph orch host drain controller-0
$ ceph orch host drain controller-0Copy to Clipboard Copied! Toggle word wrap Toggle overflow 在运行
ceph orch host drain命令前,备份/etc/ceph的内容。在运行ceph orch host drain命令后恢复内容。您必须在运行ceph orch host drain命令前备份,直到 https://bugzilla.redhat.com/show_bug.cgi?id=2153827 解析为止。从 Red Hat Ceph Storage 集群中删除
controller-0主机:ceph orch host rm controller-0
$ ceph orch host rm controller-0 Removed host 'controller-0'Copy to Clipboard Copied! Toggle word wrap Toggle overflow 退出 cephadm shell:
exit
$ exitCopy to Clipboard Copied! Toggle word wrap Toggle overflow
其它资源
- 有关使用 systemd 控制 Red Hat Ceph Storage 服务的更多信息,请参阅了解 Ceph 的进程管理。
- 如需有关编辑和应用 Red Hat Ceph Storage 规格文件的更多信息 ,请参阅使用服务规格部署 Ceph 监控守护进程。