3.3. 恢复 control plane 节点
如果在更新或升级过程中发生错误,您可以使用您使用 ReaR 创建的备份 ISO 镜像将 control plane 节点恢复到之前的状态。
要恢复 control plane,您必须恢复所有 control plane 节点以确保状态一致性。
您可以在备份节点中找到备份 ISO 镜像。将可引导 ISO 镜像刻录到 DVD,或通过 Integrated Lights-Out (iLO)远程访问将其下载到 undercloud 节点。
红帽支持对带有原生 SDN 的 Red Hat OpenStack Platform 备份,如 Open vSwitch (OVS)和默认的 Open Virtual Network (OVN)。有关第三方 SDN 的详情,请参考第三方 SDN 文档。
先决条件
- 您已创建了 control plane 节点的备份。更多信息请参阅 第 2.6 节 “创建 control plane 节点的备份”。
- 您可以访问备份节点。
-
如果将 OVS 网桥用于网络接口,您可以访问您在
NETWORKING_PREPARATION_COMMANDS参数中设置的网络配置信息。如需更多信息,请参阅 第 2.5 节 “配置 Open vSwitch (OVS)接口以进行备份”。
流程
- 关闭每个 control plane 节点。在继续操作前,请确保 control plane 节点已完全关闭。
- 使用对应的备份 ISO 镜像引导每个 control plane 节点。
当显示
Relax-and-Recover引导菜单时,在每个 control plane 节点上选择Recover <control_plane_node>。将<control_plane_node> 替换为对应 control plane 节点的名称。注意如果您的系统使用 UEFI,请选择
Relax-and-Recover (no Secure Boot)选项。在每个 control plane 节点上,以
root用户身份登录并恢复节点:显示以下信息:
Welcome to Relax-and-Recover. Run "rear recover" to restore your system! RESCUE <control_plane_node>:~ # rear recover当 control plane 节点恢复过程完成后,控制台会显示以下信息:
Finished recovering your system Exiting rear recover Running exit tasks当命令行控制台可用时,恢复每个 control plane 节点的
config-drive分区:# once completed, restore the config-drive partition (which is ISO9660) RESCUE <control_plane_node>:~ $ dd if=/mnt/local/mnt/config-drive of=<config_drive_partition>关闭该节点:
RESCUE <control_plane_node>:~ # poweroff- 将引导序列设置为普通引导设备。在引导时,节点会恢复其之前的状态。
要确保服务正确运行,请检查 pacemaker 的状态。以
root用户身份登录 Controller 节点,然后输入以下命令:# pcs status- 要查看 overcloud 的状态,请使用 OpenStack Integration Test Suite (tempest)。如需更多信息,请参阅使用 Integration Test Suite (tempest)验证您的 OpenStack 云。
故障排除
-
运行以下命令,清除
pcs status显示的资源警报:
# pcs resource clean
-
运行以下命令,清除
pcs status显示的 STONITH 隔离操作错误:
# pcs resource clean
# pcs stonith history cleanup