第 4 章 在 Compute 节点上通过 Instance HA 执行维护
要在 Compute 节点或具有 Instance HA 的 Controller 节点上执行维护,请通过将其设置为 待机模式 并禁用节点上的 Pacemaker 资源来停止该节点。完成维护工作后,您启动节点并检查 Pacemaker 资源是否健康。
前提条件
- 已启用实例 HA 的运行的 overcloud
流程
登录到 Controller 节点并停止 Compute 或 Controller 节点:
pcs node standby <node UUID>
# pcs node standby <node UUID>Copy to Clipboard Copied! Toggle word wrap Toggle overflow 重要您必须登录到与您要停止的节点不同的节点。
禁用节点上的 Pacemaker 资源:
pcs resource disable <ocf::pacemaker:remote on the node>
# pcs resource disable <ocf::pacemaker:remote on the node>Copy to Clipboard Copied! Toggle word wrap Toggle overflow - 在节点上执行任何维护工作。
- 恢复 IPMI 连接并启动节点。等待节点就绪,然后继续。
在节点上启用 Pacemaker 资源并启动节点:
pcs resource enable <ocf::pacemaker:remote on the node> pcs node unstandby <node UUID>
# pcs resource enable <ocf::pacemaker:remote on the node> # pcs node unstandby <node UUID>Copy to Clipboard Copied! Toggle word wrap Toggle overflow 如果将节点设置为维护模式,请提供 overcloud 的凭据文件,并从维护模式取消设置节点:
source stackrc openstack baremetal node maintenance unset <baremetal node UUID>
# source stackrc # openstack baremetal node maintenance unset <baremetal node UUID>Copy to Clipboard Copied! Toggle word wrap Toggle overflow
验证
检查 Pacemaker 资源是否活跃且健康:
pcs status
# pcs statusCopy to Clipboard Copied! Toggle word wrap Toggle overflow -
如果任何 Pacemaker 资源在启动过程中无法启动,请运行
pcs resource cleanup命令来重置资源的状态和失败计数。 如果您在停止节点前从 Compute 节点撤离实例,请检查实例是否已迁移到其他节点:
openstack server list --long nova migration-list
# openstack server list --long # nova migration-listCopy to Clipboard Copied! Toggle word wrap Toggle overflow