15.9. 重启之前失败的数据中心

当之前失败的数据中心恢复在线时，请按照以下步骤恢复消息传递系统的原始状态：

以下子章节显示执行这些步骤。

当您在之前失败的数据中心重启 monitor、元数据服务器、管理器和对象存储设备(OSD)节点时，您的 Red Hat Ceph Storage 集群自我修复以恢复完整的数据冗余。在此过程中，Red Hat Ceph Storage 根据需要自动将数据回填到恢复的 OSD 节点。

要验证您的存储集群是否自动自我修复和恢复完整的数据冗余，请使用之前在数据中心中断期间验证存储集群健康状况中显示的命令。当您重新执行这些命令时，您会看到上一个 HEALTH_WARN 消息所显示的百分比下降开始提高，直到它返回到 100%。

以下流程演示了如何在存储集群不再处于降级状态时重启代理服务器。

流程

停止手动启动的备份代理。

对于 Windows：

<broker_instance_dir>\bin\artemis-service.exe stop

原始 master 代理会在重启时自动将其角色恢复为 master。

重启代理服务器后，将客户端应用程序重新连接到这些代理。以下小节描述了如何重新连接内部和外部客户端应用程序。

内部客户端是那些在之前与恢复的代理相同的数据中心中运行的客户端。要重新连接内部客户端，重启它们。每个客户端应用程序都会重新连接到连接配置中指定的恢复的 master 代理。

外部客户端是那些在之前出现故障的数据中心外运行的。根据您的客户端类型以及配置外部代理客户端的信息，您可以将客户端配置为自动切换到备份代理，或者手动建立此连接。当您恢复之前失败的数据中心时，您将以类似的方式从客户端重新建立到恢复的 master 代理的连接，如下所述。