第 4 章 在 Compute 节点上通过 Instance HA 执行维护
要在 Compute 节点或带有 Instance HA 的 Controller 节点上执行维护,请通过将其设置为 待机模式
并禁用节点上的 Pacemaker 资源来停止该节点。完成维护工作后,您可以启动节点并检查 Pacemaker 资源是否健康。
前提条件
- 已启用实例 HA 的运行的 overcloud
流程
登录到 Controller 节点并停止 Compute 或 Controller 节点:
# pcs node standby <node UUID>
重要您必须登录到您要停止的节点的不同节点。
禁用节点上的 Pacemaker 资源:
# pcs resource disable <ocf::pacemaker:remote on the node>
- 在节点上执行任何维护工作。
- 恢复 IPMI 连接并启动节点。等待节点就绪,然后继续。
在节点上启用 Pacemaker 资源并启动节点:
# pcs resource enable <ocf::pacemaker:remote on the node> # pcs node unstandby <node UUID>
如果将节点设置为维护模式,请提供 overcloud 的凭据文件,并从维护模式取消设置节点:
# source stackrc # openstack baremetal node maintenance unset <baremetal node UUID>
验证
检查 Pacemaker 资源是否活跃且健康:
# pcs status
-
如果任何 Pacemaker 资源在启动过程中无法启动,请运行
pcs resource cleanup
命令来重置状态以及资源的失败计数。 如果在停止节点前从 Compute 节点撤离实例,请检查实例是否已迁移到其他节点:
# openstack server list --long # nova migration-list