7.4. 重新引导计算 HCI 节点
以下流程重启计算超融合基础架构(HCI)节点。
流程
登录 Ceph MON 或 Controller 节点,并暂时禁用 Ceph Storage 集群重新平衡:
sudo ceph osd set noout sudo ceph osd set norebalance
$ sudo ceph osd set noout $ sudo ceph osd set norebalance
Copy to Clipboard Copied! Toggle word wrap Toggle overflow -
以
stack
用户的身份登录 undercloud。 列出所有的 Compute 节点及其 UUID:
source ~/stackrc
$ source ~/stackrc (undercloud) $ openstack server list --name compute
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 确定您要重新引导的 Compute 节点的 UUID。
在 undercloud 中,选择 Compute 节点并禁用它:
source ~/overcloudrc
$ source ~/overcloudrc (overcloud) $ openstack compute service list (overcloud) $ openstack compute service set [hostname] nova-compute --disable
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 列出 Compute 节点上的所有实例:
(overcloud) $ openstack server list --host [hostname] --all-projects
(overcloud) $ openstack server list --host [hostname] --all-projects
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 使用以下命令之一迁移您的实例:
将实例迁移到您选择的特定主机:
(overcloud) $ openstack server migrate [instance-id] --live [target-host]--wait
(overcloud) $ openstack server migrate [instance-id] --live [target-host]--wait
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 让
nova-scheduler
自动选择目标主机:(overcloud) $ nova live-migration [instance-id]
(overcloud) $ nova live-migration [instance-id]
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 一次性实时迁移所有实例:
nova host-evacuate-live [hostname]
$ nova host-evacuate-live [hostname]
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 注意nova
命令可能会引发一些弃用警告,这些警告信息可以被安全忽略。
- 等待迁移完成。
确认迁移成功完成:
(overcloud) $ openstack server list --host [hostname] --all-projects
(overcloud) $ openstack server list --host [hostname] --all-projects
Copy to Clipboard Copied! Toggle word wrap Toggle overflow - 继续迁移实例,直到所选 Compute 节点中不剩任何实例。
登录到 Ceph MON 或 Controller 节点并检查集群状态:
sudo ceph -s
$ sudo ceph -s
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 确认
pgmap
报告的所有pgs
的状态是否都正常 (active+clean
)。重新引导 Compute HCI 节点:
sudo reboot
$ sudo reboot
Copy to Clipboard Copied! Toggle word wrap Toggle overflow - 稍等片刻,直到节点启动。
再次启用 Compute 节点:
source ~/overcloudrc
$ source ~/overcloudrc (overcloud) $ openstack compute service set [hostname] nova-compute --enable
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 验证 Compute 节点是否已启用:
(overcloud) $ openstack compute service list
(overcloud) $ openstack compute service list
Copy to Clipboard Copied! Toggle word wrap Toggle overflow - 注销节点,重新引导下一个节点,并检查其状态。重复此流程,直到您已重新引导所有 Ceph 存储节点。
完成后,登录 Ceph MON 或 Controller 节点,然后再次启用集群重新平衡:
sudo ceph osd unset noout sudo ceph osd unset norebalance
$ sudo ceph osd unset noout $ sudo ceph osd unset norebalance
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 执行最后的状态检查,确认集群报告
HEALTH_OK
:sudo ceph status
$ sudo ceph status
Copy to Clipboard Copied! Toggle word wrap Toggle overflow