5.16. hub 集群组件
5.16.1. Red Hat Advanced Cluster Management (RHACM) 复制链接链接已复制到粘贴板!
- 这个版本中的新内容
- 这个版本没有参考设计更新。
- 描述
Red Hat Advanced Cluster Management (RHACM) 为部署的集群提供 Multi Cluster Engine (MCE) 安装和持续生命周期管理功能。您可以通过在维护窗口期间将
Policy
自定义资源 (CR) 应用到集群来声明管理集群配置和升级。RHACM 提供如下功能:
- 在 RHACM 中使用多集群引擎组件的集群零接触置备(ZTP)和持续扩展。
- 通过 RHACM 策略控制器配置、升级和集群状态。
-
在受管集群安装过程中,RHACM 可以对通过
ClusterInstance
CR 配置的单个节点应用标签。 - RHACM 的 Topology Aware Lifecycle Manager 组件提供对受管集群的配置更改的分阶段部署。
- RHACM 多集群引擎 Observability 组件提供选择性监控、仪表板、警报和指标。
推荐的单节点 OpenShift 集群安装方法是使用多集群引擎中的基于镜像的安装方法,它使用
ClusterInstance
CR 进行集群定义。单节点 OpenShift 升级的建议方法是基于镜像的升级方法。
注意RHACM 多集群引擎 Observability 组件可让您集中查看所有受管集群的健康和状态。默认情况下,每个受管集群都启用来发送由 Cluster Monitoring Operator (CMO)创建的指标和警报,返回到 Observability。如需更多信息,请参阅"Observability"。
- 限制和要求
- 如需有关单个 hub 集群管理的集群数量的更多信息,请参阅"Telco management hub 集群使用 model"。
hub 有效地管理的受管集群数量取决于不同的因素,包括:
- 每个受管集群的资源可用性
- 策略复杂性和集群大小
- 网络利用率
- 工作负载需求和分布
- hub 和受管集群必须维护足够的双向连接。
- 工程考虑
- 您可以配置集群备份和恢复 Operator,使其包含第三方资源。
- 强烈建议您在通过策略定义配置时使用 RHACM hub 侧模板。此功能通过为每个集群或每个组启用来管理团队所需的策略数量。例如,要在策略中模板的区域或硬件类型内容,并根据集群或组替换。
-
受管集群通常具有一些特定于单个集群的配置值。它们应该使用 RHACM 策略 hub 侧模板,以及基于集群名称从
ConfigMap
CR 中拉取的值来管理。
5.16.2. Topology Aware Lifecycle Manager 复制链接链接已复制到粘贴板!
- 这个版本中的新内容
- 这个版本没有参考设计更新。
- 描述
Topology Aware Lifecycle Manager(TALM)是一个仅在 hub 集群上运行的 Operator,用于管理集群升级、Operator 升级和集群配置等更改如何应用到网络。TALM 支持以下功能:
- 在用户可配置的批处理中,对集群团队进行进度发布。
-
针对每个集群操作,在对受管集群的配置更改后添加
ztp-done
标签或其他 user-configurable 标签。 TALM 在启动升级前,支持可选的 OpenShift Container Platform、OLM Operator 和其他用户镜像到单节点 OpenShift 集群。当使用推荐的基于镜像的升级方法升级单节点 OpenShift 集群时,预缓存功能不适用。
-
使用
PreCachingConfig
CR 指定可选预缓存配置。 - 可配置镜像过滤以排除未使用的内容。
- 使用定义的空间要求参数在预缓存之前和之后存储验证。
-
使用
- 限制和要求
- TALM 支持以 500 批量进行并发集群升级。
- 预缓存仅限于单节点 OpenShift 集群拓扑。
- 工程考虑
-
PreCachingConfig
自定义资源 (CR) 是可选的。如果您只想预缓存平台相关的镜像,如 OpenShift Container Platform 和 OLM,则不需要创建它。 - TALM 支持在 Red Hat Advanced Cluster Management 策略中使用 hub 侧模板。
-
5.16.3. GitOps Operator 和 GitOps ZTP 复制链接链接已复制到粘贴板!
- 这个版本中的新内容
- 这个版本没有参考设计更新
- 描述
GitOps Operator 和 GitOps ZTP 提供了一个基于 GitOps 的基础架构,用于管理集群部署和配置。集群定义和配置在 Git 中作为声明状态进行维护。您可以将
ClusterInstance
自定义资源(CR)应用到 hub 集群,其中SiteConfig
Operator 会将它们呈现为安装 CR。在以前的版本中,GitOps ZTP 插件支持从SiteConfig
CR 生成安装 CR。此插件现已弃用。单独的 GitOps ZTP 插件可根据PolicyGenerator
或PolicyGenTemplate
CR 启用自动将配置 CR 嵌套到策略中。您可以使用基准引用配置 CR 在受管集群中部署和管理多个 OpenShift Container Platform 版本。您可以使用自定义 CR 和基线(baseline)CR。要同时维护多个每个版本策略,请使用 Git 使用
PolicyGenerator
或PolicyGenTemplate
CR 管理源 CR 的版本。- 限制和要求
- 为确保在集群或节点删除过程中对受管集群及其相关资源进行一致并完成清理,您必须将 ArgoCD 配置为使用后台删除模式。
- 工程考虑
-
为了避免在更新内容时造成混淆或意外覆盖,请在
source-crs
目录和额外清单中对自定义 CR 使用唯一的和可分辨名称。 - 将引用源 CR 保留在与自定义 CR 的独立目录中。这有助于根据需要轻松更新引用 CR。
- 为了帮助多个版本,请将所有源 CR 和策略创建 CR 保留在 Git 存储库中,以确保每个 OpenShift Container Platform 版本生成策略的一致性。
-
为了避免在更新内容时造成混淆或意外覆盖,请在
5.16.4. Local Storage Operator 复制链接链接已复制到粘贴板!
- 这个版本中的新内容
- 这个版本没有参考设计更新
- 描述
-
您可以使用 Local Storage Operator 创建可用作
PVC
资源的持久性卷。您创建的PV
资源的数量和类型取决于您的要求。 - 工程考虑
-
在创建持久性卷前,为
PV
CR 创建后备存储。这可以是分区、本地卷、LVM 卷或完整磁盘。 -
请参阅
LocalVolume
CR 中的设备列表,访问每个设备以确保正确分配磁盘和分区,例如/dev/disk/by-path/<id>
。无法保证在节点重启后逻辑名称(例如/dev/sda
)一致。
-
在创建持久性卷前,为
5.16.5. Red Hat OpenShift Data Foundation 复制链接链接已复制到粘贴板!
- 这个版本中的新内容
- 这个版本没有参考设计更新
- 描述
- Red Hat OpenShift Data Foundation 为 hub 集群提供文件、块和对象存储服务。
- 限制和要求
- 内部模式中的 Red Hat OpenShift Data Foundation (ODF) 需要 Local Storage Operator 定义提供所需底层存储的存储类。
- 在为电信管理集群规划时,请考虑 ODF 基础架构和网络要求。
- 双堆栈支持有限。在双栈集群中支持 ODF IPv4。
- 工程考虑
- 当存储容量耗尽时,因为恢复可及时解决容量警告会比较困难,请参阅容量规划。
5.16.6. 日志记录 复制链接链接已复制到粘贴板!
- 这个版本中的新内容
- 这个版本没有参考设计更新
- 描述
- 使用 Cluster Logging Operator 从节点中收集并发送日志以进行远程归档和分析。参考配置使用 Kafka 将审核和基础架构日志发送到远程归档。
- 限制和要求
- 参考配置不包括本地日志存储。
- 引用配置不包括在 hub 集群中受管集群日志的聚合。
- 工程考虑
- 集群 CPU 使用的影响取决于生成的日志的数量或大小以及配置的日志过滤量。
- 参考配置不包括应用程序日志的发布。将应用程序日志包含在配置中,需要评估应用程序日志记录率以及分配给保留集合的足够额外 CPU 资源。
5.16.7. OpenShift API for Data Protection 复制链接链接已复制到粘贴板!
- 这个版本中的新内容
- 这个版本没有参考设计更新
- 描述
启用备份功能时,由 Red Hat Advanced Cluster Management (RHACM) 自动安装和管理的 OpenShift API for Data Protection (OADP) Operator。
OADP Operator 有助于在 OpenShift Container Platform 集群中备份和恢复工作负载。根据上游的开源项目 Velero,它允许您为给定项目(包括持久性卷)备份和恢复所有 Kubernetes 资源。
虽然在 hub 集群中不需要它,但强烈建议您对 hub 集群进行集群备份、灾难恢复和高可用性架构。必须启用 OADP Operator,以便为 RHACM 使用灾难恢复解决方案。参考配置通过 RHACM Operator 提供的
MultiClusterHub
自定义资源(CR)启用备份(OADP)。- 限制和要求
- 集群中只能安装一个 OADP 版本。RHACM 安装的版本必须用于 RHACM 灾难恢复功能。
- 工程考虑
- 这个版本没有工程考虑更新。