4.11. 受管集群之间基于 ApplicationSet 的应用程序故障切换


故障转移( failover)是一个在主集群出现故障时将应用程序从主集群迁移到次要集群的过程。虽然故障转移提供了应用程序在辅助集群中运行的功能,在最少的中断中断时,进行不正确的故障转移决策可能会带来不明确的复制故障,如从主要到次要集群出现无法发生的复制故障时造成的数据丢失。如果自上次成功复制以来存在大量时间,则最好等待失败的主恢复。

LastGroupSyncTime 是一个 关键指标,它反映了与应用程序关联的所有 PVC 最后一次成功复制的时间。本质上,它会测量主集群和次要集群之间的同步健康状况。因此,在从一个集群启动故障切换前,请检查此指标,只有在 LastGroupSyncTime 在过去的合理时间内启动故障转移。

注意

在故障转移集群中故障转移 Ceph-RBD 镜像部署期间,会缩减故障转移,以确保 Ceph-RBD 支持的卷的干净故障转移作为存储置备程序。

先决条件

  • 如果您的设置有主动和被动 RHACM hub 集群,请参阅使用 Red Hat Advanced Cluster Management 进行 Hub 恢复
  • 当主集群处于 Ready 以外的状态时,请检查集群的实际状态,因为它可能需要一些时间才能更新。

    1. 进入到 RHACM 控制台 Infrastructure Clusters Cluster list 选项卡。
    2. 在执行故障转移操作前,请检查两个受管集群的状态。

      但是,当您切换到的集群处于 Ready 状态时,故障转移操作仍然可以运行。

  • 与当前时间相比,在 Hub Cluster 上运行以下命令,检查 lastGroupSyncTime 是否位于可接受的数据丢失窗口中。

    $ oc get drpc -o yaml -A | grep lastGroupSyncTime
    Copy to Clipboard Toggle word wrap

    输出示例:

    [...]
    lastGroupSyncTime: "2023-07-10T12:40:10Z"
    Copy to Clipboard Toggle word wrap

步骤

  1. 在 Hub 集群中,进入到 Applications
  2. 点应用程序行末尾的 Actions 菜单,以查看可用操作的列表。
  3. Failover application
  4. 显示 Failover 应用程序 模态时,验证显示的详细信息是否正确并检查 Failover readiness 的状态。如果状态是 Ready 且带有绿色勾号,这表示目标集群已准备好故障转移启动。

    重要

    如果因为同步延迟导致的数据不一致,则会出现警告信息来表示目标集群上的 Inconsistent 数据。如果启动故障转移,此警报可能会丢失数据。数据同步完成后不再显示消息。

  5. Initiate。busybox 资源现在在目标集群上创建。
  6. 关闭模态窗口,并使用 Applications 页面中的 Data policies 列跟踪状态。
  7. 验证活动状态是否为应用的 FailedOver

    1. 进入 Applications Overview 选项卡。
    2. Data policy 列中,点您要将策略应用到的应用程序的策略链接。
    3. Data policy 弹出窗口中,验证您可以看到一个或多个策略名称以及与应用程序中使用的策略关联的持续活动。
返回顶部
Red Hat logoGithubredditYoutubeTwitter

学习

尝试、购买和销售

社区

关于红帽文档

通过我们的产品和服务,以及可以信赖的内容,帮助红帽用户创新并实现他们的目标。 了解我们当前的更新.

让开源更具包容性

红帽致力于替换我们的代码、文档和 Web 属性中存在问题的语言。欲了解更多详情,请参阅红帽博客.

關於紅帽

我们提供强化的解决方案,使企业能够更轻松地跨平台和环境(从核心数据中心到网络边缘)工作。

Theme

© 2025 Red Hat