第 4 章 在 Compute 节点上通过 Instance HA 执行维护
要在 Compute 节点上或带有 Instance HA 的 Controller 节点上执行维护,请通过将其设置为 待机模式 并禁用节点上的 Pacemaker 资源来停止节点。完成维护工作后,您将启动该节点并检查 Pacemaker 资源是否健康。
前提条件
- 已启用实例 HA 的运行的 overcloud
流程
登录到 Controller 节点并停止 Compute 或 Controller 节点:
# pcs node standby <node UUID>重要您必须从您要停止的节点登录到不同的节点。
在节点上禁用 Pacemaker 资源:
# pcs resource disable <ocf::pacemaker:remote on the node>- 在节点上执行任何维护工作。
- 恢复 IPMI 连接并启动节点。在继续操作前,等待节点就绪。
在节点上启用 Pacemaker 资源并启动节点:
# pcs resource enable <ocf::pacemaker:remote on the node> # pcs node unstandby <node UUID>如果将节点设置为维护模式,请提供 overcloud 的凭据文件,并从维护模式取消设置节点:
# source stackrc # openstack baremetal node maintenance unset <baremetal node UUID>
验证
检查 Pacemaker 资源是否活跃且健康:
# pcs status-
如果任何 Pacemaker 资源在启动过程中无法启动,请运行
pcs resource cleanup命令来重置资源的状态和故障计数。 如果您在停止节点前从 Compute 节点撤离实例,请检查实例是否已迁移到不同的节点:
# openstack server list --long # nova migration-list