第 4 章 在 Compute 节点上通过 Instance HA 执行维护
要对 Compute 节点或带有 Instance HA 的 Controller 节点执行维护,请通过设置为 待机模式
并禁用节点上的 Pacemaker 资源来停止该节点。完成维护工作后,启动节点并检查 Pacemaker 资源是否健康。
前提条件
- 启用 Instance HA 的正在运行的 overcloud
流程
登录到 Controller 节点并停止 Compute 或 Controller 节点:
# pcs node standby <node UUID>
重要您必须登录到您要停止的节点中的不同节点。
禁用节点上的 Pacemaker 资源:
# pcs resource disable <ocf::pacemaker:remote on the node>
- 在节点上执行任何维护工作。
- 恢复 IPMI 连接并启动节点。等待节点就绪,然后继续。
在节点上启用 Pacemaker 资源并启动该节点:
# pcs resource enable <ocf::pacemaker:remote on the node> # pcs node unstandby <node UUID>
如果将节点设置为维护模式,提供 overcloud 的凭据文件,并从维护模式取消节点:
# source stackrc # openstack baremetal node maintenance unset <baremetal node UUID>
验证
检查 Pacemaker 资源是否活跃且健康:
# pcs status
-
如果有任何 Pacemaker 资源在引导过程中启动失败,请运行
pcs resource cleanup
命令重置状态以及资源失败计数。 如果在停止节点前从 Compute 节点撤离实例,请检查实例是否已迁移到其他节点:
# openstack server list --long # nova migration-list