4.3. 恢复 control plane 节点
如果在更新或升级过程中出现错误,您可以使用 ReaR 创建的备份 ISO 镜像将 control plane 节点恢复到之前的状态。要恢复 control plane,您必须恢复所有 control plane 节点,以确保状态一致性。
您可以在备份节点上找到备份 ISO 镜像。将可引导 ISO 镜像刻录到 DVD,或通过 Integrated Lights-Out (iLO)远程访问将其下载到 undercloud 节点。
红帽支持使用原生 SDN (如 Open vSwitch (OVS)和默认的 Open Virtual Network (OVN))备份 Red Hat OpenStack Platform。有关第三方 SDN 的详情,请参考第三方 SDN 文档。
前提条件
选择以下选项之一:
- 您已创建了没有可组合角色的 control plane 节点的备份。更多信息请参阅 第 2.5 节 “创建 control plane 节点的备份”。
- 您已创建了使用可组合角色的 control plane 节点的备份。更多信息请参阅 第 3.5 节 “创建使用可组合角色的 control plane 节点的备份”。
- 您可以访问备份节点。
-
如果您的网络接口使用 OVS 网桥,您可以访问您在
NETWORKING_PREPARATION_COMMANDS参数中设置的网络配置信息。如需更多信息,请参阅 第 2.4 节 “为备份配置 Open vSwitch (OVS)接口”。
流程
- 关闭每个 control plane 节点。在继续操作前,请确保完全关闭 control plane 节点。
- 使用对应的备份 ISO 镜像引导每个 control plane 节点。
当
Relax-and-Recover引导菜单显示时,在每个 control plane 节点上选择Recover <control_plane_node>。将<control_plane_node> 替换为对应的 control plane 节点的名称。注意如果您的系统使用 UEFI,请选择
Relax-and-Recover (no Secure Boot)选项。在每个 control plane 节点上,以
root用户身份登录并恢复节点:以下信息会显示:
Welcome to Relax-and-Recover. Run "rear recover" to restore your system! RESCUE <control_plane_node>:~ # rear recover当 control plane 节点恢复过程完成后,控制台会显示以下信息:
Finished recovering your system Exiting rear recover Running exit tasks当命令行控制台可用时,恢复每个 control plane 节点的
config-drive分区:# once completed, restore the config-drive partition (which is ISO9660) RESCUE <control_plane_node>:~ $ dd if=/mnt/local/mnt/config-drive of=<config_drive_partition>注意如果您使用可组合角色部署 control plane,则仅在 Controller 节点上执行此步骤。
关闭节点:
RESCUE <control_plane_node>:~ # poweroff- 将引导序列设置为正常的引导设备。在引导时,节点会恢复之前的状态。
为确保服务正确运行,请检查 pacemaker 的状态。以
root用户身份登录 Controller 节点,然后输入以下命令:# pcs status- 要查看 overcloud 的状态,请使用 OpenStack Integration Test Suite (tempest)。如需更多信息,请参阅使用 Integration Test Suite (tempest)验证 OpenStack 云。
故障排除
-
运行以下命令,清除
pcs status显示的资源警告:
# pcs resource clean
-
运行以下命令,清除
pcs status显示的 STONITH 隔离操作错误:
# pcs resource clean
# pcs stonith history cleanup