3.3. 恢复 control plane 节点
如果在更新或升级过程中发生错误,您可以使用您使用 ReaR 创建的备份 ISO 镜像将 control plane 节点恢复到之前的状态。
要恢复 control plane,您必须恢复所有 control plane 节点以确保状态一致性。
您可以在备份节点中找到备份 ISO 镜像。将可引导 ISO 镜像刻录到 DVD,或通过 Integrated Lights-Out (iLO)远程访问将其下载到 undercloud 节点。
红帽支持对带有原生 SDN 的 Red Hat OpenStack Platform 备份,如 Open vSwitch (OVS)和默认的 Open Virtual Network (OVN)。有关第三方 SDN 的详情,请参考第三方 SDN 文档。
先决条件
- 您已创建了 control plane 节点的备份。更多信息请参阅 第 2.6 节 “创建 control plane 节点的备份”。
- 您可以访问备份节点。
-
如果将 OVS 网桥用于网络接口,您可以访问您在
NETWORKING_PREPARATION_COMMANDS
参数中设置的网络配置信息。如需更多信息,请参阅 第 2.5 节 “配置 Open vSwitch (OVS)接口以进行备份”。
流程
- 关闭每个 control plane 节点。在继续操作前,请确保 control plane 节点已完全关闭。
- 使用对应的备份 ISO 镜像引导每个 control plane 节点。
当显示
Relax-and-Recover
引导菜单时,在每个 control plane 节点上选择Recover <control_plane_node>
。将<control_plane_node
> 替换为对应 control plane 节点的名称。注意如果您的系统使用 UEFI,请选择
Relax-and-Recover (no Secure Boot)
选项。在每个 control plane 节点上,以
root
用户身份登录并恢复节点:显示以下信息:
Welcome to Relax-and-Recover. Run "rear recover" to restore your system! RESCUE <control_plane_node>:~ # rear recover
Welcome to Relax-and-Recover. Run "rear recover" to restore your system! RESCUE <control_plane_node>:~ # rear recover
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 当 control plane 节点恢复过程完成后,控制台会显示以下信息:
Finished recovering your system Exiting rear recover Running exit tasks
Finished recovering your system Exiting rear recover Running exit tasks
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 当命令行控制台可用时,恢复每个 control plane 节点的
config-drive
分区:once completed, restore the config-drive partition (which is ISO9660)
# once completed, restore the config-drive partition (which is ISO9660) RESCUE <control_plane_node>:~ $ dd if=/mnt/local/mnt/config-drive of=<config_drive_partition>
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 关闭该节点:
RESCUE <control_plane_node>:~ # poweroff
RESCUE <control_plane_node>:~ # poweroff
Copy to Clipboard Copied! Toggle word wrap Toggle overflow - 将引导序列设置为普通引导设备。在引导时,节点会恢复其之前的状态。
要确保服务正确运行,请检查 pacemaker 的状态。以
root
用户身份登录 Controller 节点,然后输入以下命令:pcs status
# pcs status
Copy to Clipboard Copied! Toggle word wrap Toggle overflow - 要查看 overcloud 的状态,请使用 OpenStack Integration Test Suite (tempest)。如需更多信息,请参阅使用 Integration Test Suite (tempest)验证您的 OpenStack 云。
故障排除
-
运行以下命令,清除
pcs status
显示的资源警报:
pcs resource clean
# pcs resource clean
-
运行以下命令,清除
pcs status
显示的 STONITH 隔离操作错误:
pcs resource clean pcs stonith history cleanup
# pcs resource clean
# pcs stonith history cleanup