第 6 章 跨越数据中心的集群的指导


红帽强烈建议在数据中心部署 OpenShift Container Platform 集群的部署模型,同时确认供应商可以使用一个部署模型,在一个数据中心间可以跨越集群。本文档概述了在探索跨多个数据中心的使用集群部署时的注意事项,并描述了影响此类部署的支持性的重要指标。此类部署的设计应遵循这些原则,以便最佳地正常工作,并确保使用适当的产品支持订阅获得最高质量的支持。

警告

跨越多个数据中心的集群部署将集群作为跨位置的单一故障域进行扩展,且不被视为灾难恢复计划的替代。

具有跨越多个数据中心的集群部署的集群会根据标准 Red Hat OpenShift Container Platform 支持指南绑定。如需更多信息,请参阅 Red Hat OpenShift Container Platform 生命周期和 Red Hat Production Support Scope of Coverage

不建议部署跨越多个站点的 OpenShift Container Platform 集群。如果您需要位于许多数据中心或区域,请为每个区域或站点部署一个集群,并使用 Red Hat Advanced Cluster Management for Kubernetes (ACM)等工具来管理这些集群和部署。

一些 OpenShift Container Platform 平台对许多数据中心部署有特定的支持。详情请参阅具体平台产品文档和发行注记。其他平台可以跨越数据中心,具体取决于节点之间网络连接的质量。如需更多信息,请参阅了解 etcd 以及会影响性能的 tunables/conditions

在实施跨越许多数据中心的集群部署时,您应该努力实施 Red Hat OpenShift Container Platform 高可用性中详述的做法,以及 推荐的做法。多站点部署的一种替代方法是为每个站点部署一个由 ACM 管理的 OpenShift Container Platform 集群。

6.1. 跨集群的部署注意事项

本文档中提供的指导侧重于跨越数据中心的集群部署的一般方面。需要记住的一些注意事项:

  • 虽然跨越数据中心不受任何特殊支持要求绑定的部署设计,但这些集群具有额外的固有复杂性,在与标准单站点集群相比,需要其他考虑或支持参与(用于识别、修复和解决问题)。
  • 应用程序可能无法正常工作,或者无法在具有高 Kube API 延迟或低事务率的集群中工作。
  • 分层产品(如存储供应商)具有较低的延迟要求。在这些情况下,延迟限制由分层产品支持的构架决定。
  • 故障场景通过扩展的 control plane 扩大,以及它们的影响方式特定于部署。因此,在使用生产环境中的数据中心的部署前,机构应该在中断过程中测试并记录集群的行为,例如:

    • 当有网络分区离开一个、两个或所有 control plane 节点时
    • 当 control plane 节点之间的传输网络上有 MTU 不匹配时
    • 当延迟持续为 2 天到一个或多个 control plane 节点时
    • 当因为网络拥塞、错误配置或缺少 QoS 而导致数据包错误而发生大量变化时
  • 在许多站点、网络基础架构、存储基础架构或其他组件中部署的集群本质上具有更多故障点。网络中断或分割成为此类集群的更大威胁,特别是将节点面临相互失去联系的风险。这些多站点集群必须在设计时考虑此类故障的可能性。部署多站点集群的机构应广泛测试失败场景,并应考虑集群是否有来自所有故障点的保护。有关考虑弹性高可用性集群设计的重要方面的帮助,请联系红帽支持团队。
  • 在某些情况下,GEO 感知是必须解决最小化延迟的要求或问题,因此必须正确实施全局服务负载平衡(GSLB)方法。
返回顶部
Red Hat logoGithubredditYoutubeTwitter

学习

尝试、购买和销售

社区

关于红帽文档

通过我们的产品和服务,以及可以信赖的内容,帮助红帽用户创新并实现他们的目标。 了解我们当前的更新.

让开源更具包容性

红帽致力于替换我们的代码、文档和 Web 属性中存在问题的语言。欲了解更多详情,请参阅红帽博客.

關於紅帽

我们提供强化的解决方案,使企业能够更轻松地跨平台和环境(从核心数据中心到网络边缘)工作。

Theme

© 2025 Red Hat