第 9 章 替换 DistributedComputeHCI 节点
在硬件维护期间,您可能需要在边缘站点缩减、扩展或替换 DistributedComputeHCI 节点。要替换 DistributedComputeHCI 节点,请从您要替换的节点中删除服务,缩减节点数量,然后按照扩展这些节点的步骤进行备份。
9.1. 删除 Red Hat Ceph Storage 服务 复制链接链接已复制到粘贴板!
从集群中删除 HCI (超融合)节点前,您必须删除 Red Hat Ceph Storage 服务。要删除 Red Hat Ceph 服务,您必须从您要删除的节点上的集群服务禁用和移除 ceph-osd 服务,然后停止并禁用 mon、mgr 和 osd 服务。
流程
在 undercloud 上,使用 SSH 连接到您要删除的 DistributedComputeHCI 节点:
ssh tripleo-admin@<dcn-computehci-node>
$ ssh tripleo-admin@<dcn-computehci-node>Copy to Clipboard Copied! Toggle word wrap Toggle overflow 启动 cephadm shell。对于正在移除主机的站点,使用配置文件和密钥环文件:
sudo cephadm shell --config /etc/ceph/dcn2.conf \ --keyring /etc/ceph/dcn2.client.admin.keyring
$ sudo cephadm shell --config /etc/ceph/dcn2.conf \ --keyring /etc/ceph/dcn2.client.admin.keyringCopy to Clipboard Copied! Toggle word wrap Toggle overflow 记录与您要删除的 DistributedComputeHCI 节点关联的 OSD (对象存储设备),以便在后续步骤中使用:
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 使用 SSH 连接到同一集群中的另一节点,并从集群中删除该监控器:
sudo cephadm shell --config /etc/ceph/dcn2.conf \ --keyring /etc/ceph/dcn2.client.admin.keyring [ceph: root@dcn-computehci2-0]# ceph mon remove dcn2-computehci2-1 -c /etc/ceph/dcn2.conf removing mon.dcn2-computehci2-1 at [v2:172.23.3.153:3300/0,v1:172.23.3.153:6789/0], there will be 2 monitors
$ sudo cephadm shell --config /etc/ceph/dcn2.conf \ --keyring /etc/ceph/dcn2.client.admin.keyring [ceph: root@dcn-computehci2-0]# ceph mon remove dcn2-computehci2-1 -c /etc/ceph/dcn2.conf removing mon.dcn2-computehci2-1 at [v2:172.23.3.153:3300/0,v1:172.23.3.153:6789/0], there will be 2 monitorsCopy to Clipboard Copied! Toggle word wrap Toggle overflow - 使用 SSH 再次登录到您要从集群中删除的节点。
停止并禁用
mgr服务:Copy to Clipboard Copied! Toggle word wrap Toggle overflow 启动 cephadm shell:
sudo cephadm shell --config /etc/ceph/dcn2.conf \ --keyring /etc/ceph/dcn2.client.admin.keyring
$ sudo cephadm shell --config /etc/ceph/dcn2.conf \ --keyring /etc/ceph/dcn2.client.admin.keyringCopy to Clipboard Copied! Toggle word wrap Toggle overflow 验证节点的
mgr服务是否已从集群中移除:Copy to Clipboard Copied! Toggle word wrap Toggle overflow 注意当 mgr 服务成功删除时,从中删除 mgr 服务的节点不再被列出。
导出 Red Hat Ceph Storage 规格:
[ceph: root@dcn2-computehci2-1 ~]# ceph orch ls --export > spec.yml
[ceph: root@dcn2-computehci2-1 ~]# ceph orch ls --export > spec.ymlCopy to Clipboard Copied! Toggle word wrap Toggle overflow 编辑
spec.yaml文件中的规格:- 从 spec.yml 中删除主机 <dcn-computehci-node> 的所有实例
从以下内容中删除 <dcn-computehci-node> 条目的所有实例:
- service_type: osd
- service_type: mon
- service_type: host
重新应用 Red Hat Ceph Storage 规格:
[ceph: root@dcn2-computehci2-1 /]# ceph orch apply -i spec.yml
[ceph: root@dcn2-computehci2-1 /]# ceph orch apply -i spec.ymlCopy to Clipboard Copied! Toggle word wrap Toggle overflow 移除使用
ceph osd tree来标识的 OSD:[ceph: root@dcn2-computehci2-1 /]# ceph orch osd rm --zap 1 7 11 15 18 Scheduled OSD(s) for removal
[ceph: root@dcn2-computehci2-1 /]# ceph orch osd rm --zap 1 7 11 15 18 Scheduled OSD(s) for removalCopy to Clipboard Copied! Toggle word wrap Toggle overflow 验证正在移除的 OSD 的状态。在以下命令返回没有输出前不要继续:
[ceph: root@dcn2-computehci2-1 /]# ceph orch osd rm status OSD_ID HOST STATE PG_COUNT REPLACE FORCE DRAIN_STARTED_AT 1 dcn2-computehci2-1 draining 27 False False 2021-04-23 21:35:51.215361 7 dcn2-computehci2-1 draining 8 False False 2021-04-23 21:35:49.111500 11 dcn2-computehci2-1 draining 14 False False 2021-04-23 21:35:50.243762
[ceph: root@dcn2-computehci2-1 /]# ceph orch osd rm status OSD_ID HOST STATE PG_COUNT REPLACE FORCE DRAIN_STARTED_AT 1 dcn2-computehci2-1 draining 27 False False 2021-04-23 21:35:51.215361 7 dcn2-computehci2-1 draining 8 False False 2021-04-23 21:35:49.111500 11 dcn2-computehci2-1 draining 14 False False 2021-04-23 21:35:50.243762Copy to Clipboard Copied! Toggle word wrap Toggle overflow 验证您要删除的主机上没有保留守护进程:
[ceph: root@dcn2-computehci2-1 /]# ceph orch ps dcn2-computehci2-1
[ceph: root@dcn2-computehci2-1 /]# ceph orch ps dcn2-computehci2-1Copy to Clipboard Copied! Toggle word wrap Toggle overflow 如果守护进程仍然存在,您可以使用以下命令删除它们:
[ceph: root@dcn2-computehci2-1 /]# ceph orch host drain dcn2-computehci2-1
[ceph: root@dcn2-computehci2-1 /]# ceph orch host drain dcn2-computehci2-1Copy to Clipboard Copied! Toggle word wrap Toggle overflow 从 Red Hat Ceph Storage 集群中删除 <dcn-computehci-node> 主机:
[ceph: root@dcn2-computehci2-1 /]# ceph orch host rm dcn2-computehci2-1 Removed host ‘dcn2-computehci2-1’
[ceph: root@dcn2-computehci2-1 /]# ceph orch host rm dcn2-computehci2-1 Removed host ‘dcn2-computehci2-1’Copy to Clipboard Copied! Toggle word wrap Toggle overflow