3.12. 受管集群间基于订阅的应用程序故障切换


先决条件

  • 当主集群处于 Ready 以外的状态时,请检查集群的实际状态,因为它可能需要一些时间才能更新。

    1. 导航到 RHACM 控制台 Infrastructure Clusters Cluster list 选项卡。
    2. 在执行故障转移操作前,请检查两个受管集群的状态。

      但是,当您故障转移的集群处于 Ready 状态时,仍可执行故障转移操作。

流程

  1. Hub 集群上启用隔离。

    1. 打开 CLI 终端并编辑 DRCluster 资源,其中 <drcluster_name> 是您的唯一名称。

      Important

      在隔离了受管集群后,所有 从应用程序到 OpenShift Data Foundation 外部存储集群的通信将失败,一些 Pod 都将处于不健康状态(例如: CreateContainerError,CrashLoopBackOff)现已被隔离的集群。

      $ oc edit drcluster <drcluster_name>
      Copy to Clipboard Toggle word wrap
      apiVersion: ramendr.openshift.io/v1alpha1
      kind: DRCluster
      metadata:
      [...]
      spec:
        ## Add this line
        clusterFence: Fenced
        cidrs:
        [...]
      [...]
      Copy to Clipboard Toggle word wrap

      输出示例:

      drcluster.ramendr.openshift.io/ocp4perf1 edited
      Copy to Clipboard Toggle word wrap
    2. 主受管集群验证 Hub 集群上的隔离状态,使用您的唯一标识符替换 <drcluster_name>。

      $ oc get drcluster.ramendr.openshift.io <drcluster_name> -o jsonpath='{.status.phase}{"\n"}'
      Copy to Clipboard Toggle word wrap

      输出示例:

      Fenced
      Copy to Clipboard Toggle word wrap
    3. 验证属于 OpenShift Container Platform 集群节点的 IP 现在是否在 blocklist 中。

      $ ceph osd blocklist ls
      Copy to Clipboard Toggle word wrap

      输出示例

      cidr:10.1.161.1:0/32 2028-10-30T22:30:03.585634+0000
      cidr:10.1.161.14:0/32 2028-10-30T22:30:02.483561+0000
      cidr:10.1.161.51:0/32 2028-10-30T22:30:01.272267+0000
      cidr:10.1.161.63:0/32 2028-10-30T22:30:05.099655+0000
      cidr:10.1.161.129:0/32 2028-10-30T22:29:58.335390+0000
      cidr:10.1.161.130:0/32 2028-10-30T22:29:59.861518+0000
      Copy to Clipboard Toggle word wrap
  2. 在 Hub 集群中,进入到 Applications
  3. 点应用程序行末尾的 Actions 菜单,以查看可用操作的列表。
  4. Failover application
  5. 在显示了 Failover 应用程序 模态后,选择策略目标集群,相关的应用程序将在出现灾难时故障转移。
  6. 选择订阅组下拉菜单,验证默认选择或修改此设置。

    默认情况下,选择为应用程序资源复制的订阅组。

  7. 检查 Failover readiness 的状态。

    • 如果状态是 Ready 且带有一个绿色勾号,这表示目标集群已就绪,可启动故障转移。继续执行第 7 步。
    • 如果状态是 UnknownNot ready,请等待到状态变为 Ready
  8. Initiate。busybox 应用程序现在故障转移到 Secondary-managed 集群
  9. 关闭模态窗口,并使用 Applications 页面中的 Data policies 列跟踪状态。
  10. 验证活动状态是否为应用的 FailedOver

    1. 进入 Applications Overview 选项卡。
    2. Data policy 列中,点您要将策略应用到的应用程序的策略链接。
    3. Data policy 弹出窗口中,点 View more details 链接。
返回顶部
Red Hat logoGithubredditYoutubeTwitter

学习

尝试、购买和销售

社区

关于红帽文档

通过我们的产品和服务,以及可以信赖的内容,帮助红帽用户创新并实现他们的目标。 了解我们当前的更新.

让开源更具包容性

红帽致力于替换我们的代码、文档和 Web 属性中存在问题的语言。欲了解更多详情,请参阅红帽博客.

關於紅帽

我们提供强化的解决方案,使企业能够更轻松地跨平台和环境(从核心数据中心到网络边缘)工作。

Theme

© 2025 Red Hat