3.13. 在受管集群间重新定位应用程序


当所有受管集群都可用时,将应用程序重新定位到首选位置。

前提条件

  • 如果您的设置具有主动和被动 RHACM hub 集群,请参阅使用 Advanced Cluster Management Hub 恢复
  • 当主集群处于 Ready 以外的状态时,请检查集群的实际状态,因为它可能需要一些时间才能更新。只有在主集群和首选集群启动并运行时才可执行重新定位。

    1. 导航到 RHACM 控制台 Infrastructure Clusters Cluster list 选项卡。
    2. 在执行重新定位操作前,请单独检查两个受管集群的状态。
  • 在取消隔离前,验证应用程序是否已从集群中清理。

流程

  1. 在 Hub 集群中禁用隔离功能。

    1. 编辑此集群的 DRCluster 资源

      注意

      <drcluster_name> 替换为您的唯一名称。

      $ oc edit drcluster <drcluster_name>
      apiVersion: ramendr.openshift.io/v1alpha1
      kind: DRCluster
      metadata:
      [...]
      spec:
        cidrs:
        [...]
        ## Modify this line
        clusterFence: Unfenced
        [...]
      [...]

      输出示例:

      drcluster.ramendr.openshift.io/ocp4perf1 edited
    2. 正常重新引导了 Fenced 的 OpenShift Container Platform 节点。重启后,需要重启来恢复 I/O 操作,以避免进一步恢复编配失败。按照安全重启节点的步骤,重新引导集群中的所有节点。

      注意

      先确保所有节点已被封锁和排空,然后再重新引导并在节点上执行 uncordon 操作。

    3. 在所有 OpenShift 节点被重新引导并处于 Ready 状态后,通过在主受管集群中运行此命令(或任何集群是 Unfenced),验证所有 Pod 都处于健康状态。

      oc get pods -A | egrep -v 'Running|Completed'

      输出示例:

      NAMESPACE                                          NAME                                                              READY   STATUS      RESTARTS       AGE

      此查询的输出应该为零个 Pod,然后继续下一步。

      重要

      如果因为严重的存储通信导致 pod 仍然处于不健康状态,请在继续操作前进行故障排除并解决。由于存储集群位于 OpenShift 的外部,因此在 OpenShift 应用正常运行的站点中断后,还必须正确恢复它。

      另外,您可以使用 OpenShift Web 控制台仪表板和 Overview 选项卡来评估应用程序和外部 ODF 存储集群的健康状态。详细的 OpenShift Data Foundation 仪表板可通过 Storage Data Foundation 找到。

    4. 验证 Unfenced 集群是否处于健康状态。为 Primary 受管集群验证 Hub 集群中的隔离状态。

      注意

      <drcluster_name> 替换为您的唯一名称。

      $ oc get drcluster.ramendr.openshift.io <drcluster_name> -o jsonpath='{.status.phase}{"\n"}'

      输出示例:

      Unfenced
    5. 验证属于 OpenShift Container Platform 集群节点的 IP 不在 blocklist 中。

      $ ceph osd blocklist ls

      确保您没有看到隔离过程中添加的 IP。

  2. 在 Hub 集群中,进入到 Applications
  3. 点应用程序行末尾的 Actions 菜单,以查看可用操作的列表。
  4. Relocate application
  5. Relocate application 弹出窗口显示时,选择 policytarget cluster,在出现灾难时相关的应用程序将重新定位到其中。
  6. 默认情况下,选择部署应用程序资源的订阅组。点选择订阅组下拉菜单,验证默认选择或修改此设置。
  7. 检查 Relocation readiness 的状态。

    • 如果状态是 Ready 且带有一个绿色勾号,这表示目标集群已准备好重定位来进行启动。继续执行第 7 步。
    • 如果状态是 UnknownNot ready,请等待到状态变为 Ready
  8. Initiate。busybox 资源现在在目标集群上创建。
  9. 关闭模态窗口,并使用 Applications 页面中的 Data policies 列跟踪状态。
  10. 验证应用程序的活动状态是否显示为 Relocated

    1. 进入 Applications Overview 选项卡。
    2. Data policy 列中,点您要将策略应用到的应用程序的策略链接。
    3. Data policies 模态页面中,点 View more details 链接。
Red Hat logoGithubRedditYoutubeTwitter

学习

尝试、购买和销售

社区

关于红帽文档

通过我们的产品和服务,以及可以信赖的内容,帮助红帽用户创新并实现他们的目标。

让开源更具包容性

红帽致力于替换我们的代码、文档和 Web 属性中存在问题的语言。欲了解更多详情,请参阅红帽博客.

關於紅帽

我们提供强化的解决方案,使企业能够更轻松地跨平台和环境(从核心数据中心到网络边缘)工作。

© 2024 Red Hat, Inc.