1.5. 使用多集群引擎 operator 的集群生命周期发行注记


了解 multicluster engine operator 版本 2.10 的集群生命周期的新功能、支持、弃用、删除和固定问题。

重要: OpenShift Container Platform 发行注记 没有 包括在此文档中。对于 OpenShift Container Platform 集群,请参阅 OpenShift Container Platform 发行注记

已弃用: 不再支持 multicluster engine operator 2.4 及更早的版本。文档可能仍然可用,但没有任何勘误版本用于固定问题或其他更新。

最佳实践: 升级到最新版本。

了解 Kubernetes operator 2.10 的新功能、功能增强、弃用、删除以及勘误发行版本的固定问题的信息。

multicluster engine operator 版本 2.10 使用 Red Hat Advanced Cluster Management 版本 2.15 进行 Cluster 生命周期管理发布,但您也可以将独立多集群引擎 operator 与 OpenShift Container Platform hub 集群一起使用。

有关全面支持信息,包括支持的 OpenShift Container Platform 版本,请参阅 multicluster engine operator Support Matrix。如需生命周期信息,请参阅 Red Hat OpenShift Container Platform 生命周期政策

使用多集群引擎 operator 功能在各种基础架构云供应商、私有云和内部数据中心中创建、导入、管理和销毁 Kubernetes 集群。

重要:

  • 集群管理支持通过云原生计算基础(CNCF) Kubernetes 一致性计划认证的所有供应商。为混合云多集群管理选择 CNCF 可识别的供应商。请参阅以下有关使用 CNCF 供应商的信息:
  • 了解 CNCF 供应商如何通过认证的 Kubernetes 一致性进行认证
  • 有关 CNCF 第三方供应商的信息,请参阅红帽 与第三方组件的支持,或 联系红帽支持
  • 如果您具有自己的 CNCF 一致性认证集群,您需要将 OpenShift Container Platform CLI oc 命令改为 Kubernetes CLI 命令 kubectl

1.5.1.1. 每个组件的新功能和增强

了解有关特定组件的新功能的更多信息。

注意: 一些功能和组件 作为技术预览 发布。

了解 multicluster engine operator 安装附带的新功能和增强:

了解 multicluster engine operator 的集群生命周期的新功能和增强:

如果您在安装 Red Hat Advanced Cluster Management 中使用 multicluster engine operator,请参阅 Red Hat Advanced Cluster Management 这个版本的新功能和增强

默认情况下,勘误 版本的固定问题会在发布时自动应用。当发行版本可用时,会在此处发布详情。如果没有列出发行注记,则该产品目前没有勘误版本。

重要: 为了便于参考,JIRA 链接和 JIRA 号可能会添加到内容中并在内部使用。用户可能不能使用访问的链接。了解红帽 的勘误类型

查看 multicluster engine operator 的集群生命周期 的已知问题,或从上一发行版本中继续存在的已知问题。

集群管理已知问题和限制是 multicluster engine operator 文档的集群生命周期 的一部分。 Red Hat Advanced Cluster Management 集成的 multicluster engine operator 的已知问题包括在 Red Hat Advanced Cluster Management 发行注记中

重要: OpenShift Container Platform 发行注记没有包括在此文档中。对于 OpenShift Container Platform 集群,请参阅 OpenShift Container Platform 发行注记

1.5.3.1. 安装

了解在 multicluster engine operator 安装过程中已知的问题和限制。

在 multicluster engine operator 升级或修改 ClusterPool 自定义资源定义的过程中,Hive 可能删除并重新创建所有未声明的集群。这是预期的行为,并确保未声明的集群反映更新的 ClusterPool 资源规格中定义的最新配置。

ACM-21686

1.5.3.1.2. installNamespace 字段只能有一个值

启用 managed-serviceaccount 附加组件时,ManagedClusterAddOn 资源中的 installNamespace 字段必须有 open-cluster-management-agent-addon 值。其他值将被忽略。managed-serviceaccount 附加组件代理总是在受管集群上的 open-cluster-management-agent-addon 命名空间中部署。

ACM-7523

1.5.3.2. 集群管理

了解 multicluster engine operator 的集群生命周期的已知问题,如创建、发现、导入和删除集群的问题,以及 multicluster engine operator 的更多集群管理问题。

OpenShift Container Platform 托管 control plane 无法管理 AWS 中的基础架构资源,因为 cluster-api-provider-aws 资源与由 hypershift -local-hosting 组件安装的 hypershift 资源之间有 API 冲突。

要将 hypershift 组件用于 AWS 平台托管集群,请不要 启用 cluster-apicluster-api-provider-aws 组件,它们默认设置为 enabled: false。请参阅以下禁用组件的默认设置:

      - configOverrides: {}
        enabled: false
        name: cluster-api
      - configOverrides: {}
        enabled: false
        name: cluster-api-provider-aws
Copy to Clipboard Toggle word wrap

确保启用了 hypershift-local-hosting,因为它位于以下 YAML 示例中,即不启用之前的组件。

      - configOverrides: {}
        enabled: true
        name: hypershift-local-hosting
Copy to Clipboard Toggle word wrap

ACM-21708

如果您使用 node-role.kubernetes.io/infra 污点对基础架构节点具有 NoExecute 效果,则附加组件 pod 可能会卡住。

要临时解决这个问题,对于 node-role.kubernetes.io/infra 污点使用 NoSchedule effect 而不是 NoExecute,或者从您的基础架构节点中删除 node-role.kubernetes.io/infra 污点。

ACM-15906

1.5.3.2.3. nmstate的限制

通过配置复制和粘贴功能来加快开发速度。要在 assisted-installer 中配置 copy-from-mac 功能,您必须将 mac-address 添加到 nmstate 定义接口和 mac-mapping 接口。mac-mapping 接口在 nmstate 定义接口之外提供。因此,您必须提供相同的 mac-address 两次。

ACM-9128

1.5.3.2.4. 删除受管集群集不会自动删除其标签

删除 ManagedClusterSet 后,添加到每个受管集群的标签不会被自动删除。从已删除受管集群集中包含的每个受管集群手动删除该标签。该标签类似以下示例:cluster.open-cluster-management.io/clusterset:<ManagedClusterSet Name>

ACM-20727

1.5.3.2.5. ClusterClaim 错误

如果您针对 ClusterPool 创建 Hive ClusterClaim 并手动将 ClusterClaimspec 生命周期字段设置为无效的 golang 时间值,则产品将停止实现并协调所有 ClusterClaims,而不仅仅是不正确的声明。

您在 clusterclaim-controller pod 日志中看到以下错误,这是带有 PoolName 和无效生命周期的 特定示例

E0203 07:10:38.266841       1 reflector.go:138] sigs.k8s.io/controller-runtime/pkg/cache/internal/informers_map.go:224: Failed to watch *v1.ClusterClaim: failed to list *v1.ClusterClaim: v1.ClusterClaimList.Items: []v1.ClusterClaim: v1.ClusterClaim.v1.ClusterClaim.Spec: v1.ClusterClaimSpec.Lifetime: unmarshalerDecoder: time: unknown unit "w" in duration "1w", error found in #10 byte of ...|time":"1w"}},{"apiVe|..., bigger context ...|clusterPoolName":"policy-aas-hubs","lifetime":"1w"}},{"apiVersion":"hive.openshift.io/v1","kind":"Cl|...
Copy to Clipboard Toggle word wrap

您可以删除无效的声明。

如果删除了不正确的声明,则声明可以在不需要进一步交互的情况下再次成功进行协调。

ACM-19968

1.5.3.2.6. 产品频道与置备的集群不同步

clusterimageset 处于 fast 频道,但置备的集群处于 stable 频道。目前,产品不会将 频道 同步到置备的 OpenShift Container Platform 集群。

进入 OpenShift Container Platform 控制台中的正确频道。点 Administration > Cluster Settings > Details Channel

ACM-18380

当满足以下条件时,配置为自动置备受管集群的 Automation 模板可能会失败:

  • hub 集群启用了集群范围代理。
  • Ansible Automation Platform 只能通过代理访问。

ACM-17659

1.5.3.2.8. 无法手动删除受管集群命名空间

您无法手动删除受管集群的命名空间。受管集群命名空间会在受管集群分离后自动删除。如果在分离受管集群前手动删除受管集群命名空间,受管集群会在删除受管集群后显示持续终止状态。要删除此正在终止的受管集群,请从分离的受管集群中手动删除终结器。

13474

当您在云供应商一端更改云供应商访问密钥时,您还需要在 multicluster engine operator 的控制台中更新此云供应商的对应凭证。当凭证在托管受管集群的云供应商过期并尝试删除受管集群时,需要此项。

ACM-3706

1.5.3.2.10. 销毁集群的进程没有完成

当销毁受管集群时,在一小时后仍然继续显示 Destroying 状态,且集群不会被销毁。要解决这个问题请完成以下步骤:

  1. 手动确保云中没有孤立的资源,,且清理与受管集群关联的所有供应商资源。
  2. 输入以下命令为正在删除的受管集群打开 ClusterDeployment

    oc edit clusterdeployment/<mycluster> -n <namespace>
    Copy to Clipboard Toggle word wrap

    mycluster 替换为您要销毁的受管集群的名称。

    使用受管集群的命名空间替换 namespace

  3. 删除 hive.openshift.io/deprovision finalizer,以强制停止尝试清理云中的集群资源的进程。
  4. 保存您的更改,验证 ClusterDeployment 是否已不存在。
  5. 运行以下命令手动删除受管集群的命名空间:

    oc delete ns <namespace>
    Copy to Clipboard Toggle word wrap

    使用受管集群的命名空间替换 namespace

ACM-4748

您不能使用 Red Hat Advanced Cluster Management 控制台升级 OpenShift Container Platform Dedicated 环境中的 OpenShift Container Platform 受管集群。

ACM-8922

在 Red Hat Advanced Cluster Management 版本 2.10 及更新的版本中默认启用 ManagedServiceAccount 和集群代理附加组件。如果升级后禁用了附加组件,您必须手动启用 ManagedServiceAccount 和 cluster 代理附加组件,以使用 pod 日志功能。

请参阅 ManagedServiceAccount 附加组件 以了解如何启用 ManagedServiceAccount 和 配置集群代理附加组件 以了解如何启用集群代理附加组件。

ACM-11034

1.5.3.2.13. 客户端无法访问 iPXE 脚本

iPXE 是开源网络引导固件。如需了解更多详细信息,请参阅 iPXE

引导节点时,一些 DHCP 服务器中的 URL 长度限制会关闭 InfraEnv 自定义资源定义中的 ipxeScript URL,从而导致在控制台中的以下错误消息:

no bootable devices

要临时解决这个问题,请完成以下步骤:

  1. 在使用辅助安装时应用 InfraEnv 自定义资源定义以公开 bootArtifacts,它可能类似以下文件:
status:
  agentLabelSelector:
    matchLabels:
      infraenvs.agent-install.openshift.io: qe2
  bootArtifacts:
    initrd: https://assisted-image-service-multicluster-engine.redhat.com/images/0000/pxe-initrd?api_key=0000000&arch=x86_64&version=4.11
    ipxeScript: https://assisted-service-multicluster-engine.redhat.com/api/assisted-install/v2/infra-envs/00000/downloads/files?api_key=000000000&file_name=ipxe-script
    kernel: https://mirror.openshift.com/pub/openshift-v4/x86_64/dependencies/rhcos/4.12/latest/rhcos-live-kernel-x86_64
    rootfs: https://mirror.openshift.com/pub/openshift-v4/x86_64/dependencies/rhcos/4.12/latest/rhcos-live-rootfs.x86_64.img
Copy to Clipboard Toggle word wrap
  1. 创建代理服务器以使用短 URL 公开 bootArtifacts
  2. 运行以下命令复制 bootArtifacts 并将其添加到代理中:

    for artifact in oc get infraenv qe2 -ojsonpath="{.status.bootArtifacts}" | jq ". | keys[]" | sed "s/\"//g"
    do curl -k oc get infraenv qe2 -ojsonpath="{.status.bootArtifacts.${artifact}}"` -o $artifact
    Copy to Clipboard Toggle word wrap
  3. ipxeScript 工件代理 URL 添加到 libvirt.xml 中的 bootp 参数。

ACM-25157

1.5.3.2.14. ManagedClusterSet API 规格限制

使用 Clustersets API 时不支持 selectorType: LaberSelector 设置。支持 selectorType: ExclusiveClusterSetLabel 设置。

ACM-6423

当使用 ClusterCurator 资源升级 OpenShift Container Platform Dedicated 集群时,升级会失败,因为 Cluster curator 不支持 OpenShift Container Platform Dedicated 集群。

ACM-10154

1.5.3.2.16. 自定义入口域无法正确应用

您可以在安装受管集群时使用 ClusterDeployment 资源指定自定义 ingress 域,但更改仅在使用 SyncSet 资源安装后才会生效。因此,clusterdeployment.yaml 文件中的 spec 字段显示您指定的自定义入口域,但 status 仍然会显示默认域。

ACM-6279

MultiClusterEngineMultiClusterHub 资源中配置的 tolerationsnodeSelector 设置不会影响本地集群中部署的 managed-serviceaccount 代理。本地集群中并不总是需要 managed-serviceaccount 附加组件。

如果需要 managed-serviceaccount 附加组件,您可以通过完成以下步骤来临时解决这个问题:

  1. 创建 addonDeploymentConfig 自定义资源。
  2. 为本地集群和 managed-serviceaccount 代理设置 tolerationsnodeSelector 值。
  3. 更新本地集群命名空间中的 managed-serviceaccount ManagedClusterAddon,以使用您创建的 addonDeploymentConfig 自定义资源。

有关如何使用 addonDeploymentConfig 自定义资源为附加组件配置 容限nodeSelector 的更多信息,请参阅配置 klusterlet 附加组件

ACM-7523

1.5.3.3. 中央基础架构管理

了解使用多集群引擎 operator 的中央基础架构管理的已知问题和限制。

如果要在 4.19 之前使用 Red Hat OpenShift Container Platform 版本安装单节点 OpenShift 集群,您的 InfraEnv 自定义资源和引导的主机必须使用您要安装单节点 OpenShift 集群的相同 OpenShift Container Platform 版本。如果版本不匹配,安装会失败。

要临时解决这个问题,请在使用 Discovery ISO 引导主机前编辑 InfraEnv 资源,并包含以下内容:将 <4.x > 替换为您要安装的 osImageVersion:

apiVersion: agent-install.openshift.io/v1beta1
kind: InfraEnv
spec:
  osImageVersion: "<4.x>"
Copy to Clipboard Toggle word wrap

ACM-14943

您不能使用主机清单或 InfraEnv 自定义资源来通过发现镜像进行两个引导,并自动添加主机。如果您将之前的 InfraEnv 资源用于 BareMetalHost 资源,并且希望自行引导镜像,您可以通过创建一个新的 InfraEnv 资源来解决此问题。

ACM-14719

1.5.3.3.3. 在删除 BareMetalHost 资源后节点关闭

如果您从 hub 集群中删除 BareMetalHost 资源,节点会关闭。您可以再次手动打开节点电源。

ACM-15319

了解产品何时被弃用或从多集群引擎 operator 中删除。考虑推荐操作中的备选操作和详细信息,它们显示在当前版本的表中和之前两个版本。如果没有为该部分添加条目,则会删除表。

已弃用: 不再支持 multicluster engine operator 2.5 及更早的版本。文档可能仍然可用,但没有任何勘误版本用于固定问题或其他更新。

最佳实践: 升级到最新版本。

1.5.4.1. 产品弃用和删除

弃用(deprecated)组件、功能或服务会被支持,但不推荐使用,并可能在以后的版本中被删除。考虑使用推荐操作中的相应的替代操作,详情在下表中提供:

Expand
表 1.4. 多集群引擎 Operator 已弃用 项目的表列表
产品或类别受影响的项Version推荐的操作详情和链接

API 文档

multicluster engine operator API 文档

多集群引擎 operator 2.8

从控制台或终端查看当前支持的 API,而不是文档

None

KlusterletConfig

hubKubeAPIServerProxyConfig 字段在 KlusterletConfig spec 中已弃用。

2.7

使用 hubKubeAPIServerConfig.proxyURLhubKubeAPIServerConfig.trustedCABundles 字段。

None

KlusterletConfig

hubKubeAPIServerURL 字段在 KlusterletConfig spec 中已弃用。

2.7

使用 hubKubeAPIServerConfig.url 字段。

None

KlusterletConfig

hubKubeAPIServerCABundle 字段在 KlusterletConfig spec 中已弃用

2.7

使用 hubKubeAPIServerConfig.serverVerificationStrategyhubKubeAPIServerConfig.trustedCABundles 字段。

None

一个删除(removed) 的项通常是在之前的版本中被弃用的功能,在该产品中不再可用。您必须将 alternatives 用于删除的功能。考虑使用推荐操作中的相应的替代操作,详情在下表中提供:

Expand
表 1.5. 多集群引擎 operator 删除 的项目列表
产品或类别受影响的项Version推荐的操作详情和链接

集群生命周期

auto- import-secret.yaml 中的 auto ImportRetry字段

2.9

None

None

返回顶部
Red Hat logoGithubredditYoutubeTwitter

学习

尝试、购买和销售

社区

关于红帽文档

通过我们的产品和服务,以及可以信赖的内容,帮助红帽用户创新并实现他们的目标。 了解我们当前的更新.

让开源更具包容性

红帽致力于替换我们的代码、文档和 Web 属性中存在问题的语言。欲了解更多详情,请参阅红帽博客.

關於紅帽

我们提供强化的解决方案,使企业能够更轻松地跨平台和环境(从核心数据中心到网络边缘)工作。

Theme

© 2025 Red Hat