第 1 章 Regional-DR 介绍
灾难恢复是从自然或人为的灾难中恢复并继续业务关键应用程序的能力。它是任何主要组织的整体业务连续性战略,旨在在重大危险事件期间保持业务运营的连续性。
Regional-DR(区域 DR) 功能在地理分散的网站之间提供卷持久数据和元数据复制。在公共云中,它们类似于防止区域故障。区域 DR 可以在一个地理区域出现问题时确保业务的连续性(在可以接受一些可预测数量的数据丢失的情况下)。这通常通过 Recovery Point Objective (RPO) 和 Recovery Time Objective (RTO) 代表。
- RPO 是一种衡量持久性数据备份或快照的频率。实际上,RPO 表示在中断后将丢失或需要重新输入的数据量。
- RTO 是企业可以容忍的停机时间。RTO 回答了这个问题,"在收到业务中断通知后,我们的系统需要多久才能恢复?"
本指南旨在详细介绍配置基础架构以启用灾难恢复所需的步骤和命令。
1.1. 区域 DR 解决方案的组件 复制链接链接已复制到粘贴板!
region-DR 由 Red Hat Advanced Cluster Management for Kubernetes(RHACM)和 OpenShift Data Foundation 组件组成,以便在 OpenShift Container Platform 集群中提供应用程序和数据移动性。
Red Hat Advanced Cluster Management for Kubernetes(RHACM)
RHACM 提供管理多个集群和应用程序生命周期的能力。因此,它充当多集群环境中的控制平面。
RHACM 分为两个部分:
- RHACM Hub:在多集群 control plane 上运行的组件
- 受管集群:在受管理的集群中运行的组件
有关此产品的更多信息,请参阅 RHACM 文档 和 RHACM"管理应用程序"文档。
OpenShift Data Foundation
OpenShift Data Foundation 为 OpenShift Container Platform 集群中有状态应用程序提供部署和管理存储的功能。
OpenShift Data Foundation 由 Ceph 作为存储提供商提供支持,其生命周期由 OpenShift Data Foundation 组件堆栈中的 Rook 进行管理。Ceph-CSI 为有状态应用提供持久卷的调配与管理。
OpenShift Data Foundation 已增强来实现以下功能:
- 启用用于镜像的池
- 在 RBD 池间自动对镜像(image)进行镜像
- 提供 csi-addons 以管理每个持久性卷声明镜像
OpenShift DR
OpenShift DR 是一个灾难恢复器,用于一组对等 OpenShift 集群内的有状态应用,这些集群使用 RHACM 进行部署和管理,并提供云原生接口来编排持久卷上应用状态的生命周期。它们是:
- 保护跨 OpenShift 集群的应用状态关系
- 在当前部署的集群不可用的情况下将应用程序的状态故障转移到对等集群
- 将应用的状态重新定位到之前部署的集群
OpenShift DR 被分成三个组件:
- ODF Multicluster Orchestrator: Installed on the multi-cluster control plane(RHACM Hub),创建一个 bootstrap 令牌,并在受管集群间交换这个令牌。
- OpenShift DR Hub Operator :在 hub 集群上安装,以管理应用程序的故障转移和重新定位。
- OpenShift DR Cluster Operator :安装在每个受管集群上,以管理应用程序的所有 PVC 的生命周期。