5.4. 重新引导计算 HCI 节点
以下流程重启计算超融合基础架构(HCI)节点。
流程
登录 Ceph MON 或 Controller 节点,并暂时禁用 Ceph Storage 集群重新平衡:
$ sudo ceph osd set noout $ sudo ceph osd set norebalance
-
以
stack
用户的身份登录 undercloud。 列出所有的 Compute 节点及其 UUID:
$ source ~/stackrc (undercloud) $ openstack server list --name compute
确定您要重新引导的 Compute 节点的 UUID。
在 undercloud 中,选择 Compute 节点并禁用它:
$ source ~/overcloudrc (overcloud) $ openstack compute service list (overcloud) $ openstack compute service set [hostname] nova-compute --disable
列出 Compute 节点上的所有实例:
(overcloud) $ openstack server list --host [hostname] --all-projects
使用以下命令之一迁移您的实例:
将实例迁移到您选择的特定主机:
(overcloud) $ openstack server migrate [instance-id] --live [target-host]--wait
让
nova-scheduler
自动选择目标主机:(overcloud) $ nova live-migration [instance-id]
一次性实时迁移所有实例:
$ nova host-evacuate-live [hostname]
注意nova
命令可能会引发一些弃用警告,这些警告信息可以被安全忽略。
- 等待迁移完成。
确认迁移成功完成:
(overcloud) $ openstack server list --host [hostname] --all-projects
- 继续迁移实例,直到所选 Compute 节点中不剩任何实例。
登录到 Ceph MON 或 Controller 节点并检查集群状态:
$ sudo ceph -s
确认
pgmap
报告的所有pgs
的状态是否都正常 (active+clean
)。重新引导 Compute HCI 节点:
$ sudo reboot
- 稍等片刻,直到节点启动。
再次启用 Compute 节点:
$ source ~/overcloudrc (overcloud) $ openstack compute service set [hostname] nova-compute --enable
验证 Compute 节点是否已启用:
(overcloud) $ openstack compute service list
- 注销节点,重新引导下一个节点,并检查其状态。重复此流程,直到您已重新引导所有 Ceph 存储节点。
完成后,登录 Ceph MON 或 Controller 节点,然后再次启用集群重新平衡:
$ sudo ceph osd unset noout $ sudo ceph osd unset norebalance
执行最后的状态检查,确认集群报告
HEALTH_OK
:$ sudo ceph status