主页
产品
Red Hat Advanced Cluster Management for Kubernetes
2.12
发行注记

发行注记

Red Hat Advanced Cluster Management for Kubernetes 2.12

了解新功能，访问 Red Hat Advanced Cluster Management 支持列表，并查看勘误更新。查找已知问题和限制、弃用和删除以及 GDPR 和 FIPS 就绪的信息。

法律通告

摘要

参阅更多与发行注记相关的信息，了解新的、勘误更新、已知问题、弃用和删除以及 GDPR 和 FIPS 就绪的产品注意事项。

第 1 章 Red Hat Advanced Cluster Management 发行注记
复制链接

了解新功能、增强功能、支持、弃用、删除和勘误程序错误修复。

重要： 集群生命周期组件和功能位于多集群引擎 operator 中，它是增强集群管理的软件操作器。多集群引擎 operator 的 Cluster 生命周期的发行注记包括在发行注记中。

Red Hat Advanced Cluster Management 的新内容
Red Hat Advanced Cluster Management 的勘误更新
Red Hat Advanced Cluster Management 的已知问题和限制
为 Red Hat Advanced Cluster Management 弃用和删除
Red Hat Advanced Cluster Management for Kubernetes 针对 GDPR 的注意事项
FIPS 就绪性
Observability 支持

重要： OpenShift Container Platform 发行注记没有包括在此文档中。对于 OpenShift Container Platform 集群，请参阅 OpenShift Container Platform 发行注记。

弃用： Red Hat Advanced Cluster Management 2.8 及更早的版本不再被支持。文档可能仍然可用，但没有任何勘误或其他更新。

最佳实践： 升级到最新版本。

文档会引用最早支持的 Red Hat OpenShift Container Platform 版本，除非文档中的组件只与特定版本的 OpenShift Container Platform 进行创建和测试。
有关完全支持信息，请参阅 Red Hat Advanced Cluster Management Support Matrix 以及 Red Hat Advanced Cluster Management for Kubernetes 的生命周期和更新策略。
如果您在当前支持的某个版本或产品文档时遇到问题，请访问红帽支持，您可以在其中进行故障排除、查看知识库文章、与支持团队连接，或者创建一个问题单。您必须使用您的凭证登录。
您还可以访问红帽客户门户文档，Red Hat Customer Portal FAQ。

1.1. Red Hat Advanced Cluster Management 的新内容
复制链接

Red Hat Advanced Cluster Management for Kubernetes 为您提供了整个 Kubernetes 域的可见性，以及内置监管、集群生命周期管理和应用程序生命周期管理功能。

重要： Red Hat Advanced Cluster Management 现在支持通过云原生计算基础(CNCF) Kubernetes 一致性计划认证的所有供应商。为混合云多集群管理选择 CNCF 可识别的供应商。

请参阅以下有关使用 CNCF 供应商的信息：

了解 CNCF 供应商如何通过认证的 Kubernetes 一致性进行认证。
有关 CNCF 第三方供应商的信息，请参阅红帽与第三方组件的支持，或联系红帽支持。
如果您具有自己的 CNCF 一致性认证集群，您需要将 OpenShift Container Platform CLI oc 命令改为 Kubernetes CLI 命令 kubectl。

1.1.1. 组件的新功能和增强
复制链接

了解 Red Hat Advanced Cluster Management 中组件的详情：

安装
控制台（Console）
Clusters
多集群全局 hub
Observability（可观察性）
监管
备份和恢复

一些功能和组件作为技术预览发布。

访问 Red Hat Advanced Cluster Management 支持列表，了解 hub 集群和受管集群的要求以及每个组件的支持。如需生命周期信息，请参阅 Red Hat OpenShift Container Platform 生命周期政策。

1.1.2. 安装
复制链接

您可以从集群中部署的 MultiClusterHub 自定义资源启用 SiteConfig 组件。默认情况下禁用 SiteConfig 组件。请参阅 MultiClusterHub 高级配置了解更多信息。参阅 SiteConfig 了解更多有关 SiteConfig 操作器的信息。
现在，在使用 SiteConfig operator 时，可以在断开连接的环境中镜像镜像。请参阅为断开连接的环境镜像镜像。
现在，当 MultiClusterHub 资源准备安装多集群引擎 operator 时，它会实现 CatalogSource 优先级作为条件。Red Hat Advanced Cluster Management MultiClusterHub 资源查找 CatalogSource，其中包含与当前 Red Hat Advanced Cluster Management 版本兼容的所需多集群引擎 operator 版本。在断开连接的环境中安装中的 目录源优先级 一节中了解更多信息。

1.1.3. 控制台（Console）
复制链接

了解 Red Hat Advanced Cluster Management 集成控制台中的新功能。

现在，在控制台中提供了命令行界面(CLI)下载，它们可从 acm-cli 容器镜像获得，并使用操作系统和架构指定。请参阅命令行工具来访问命令行界面(CLI)下载，如 PolicyGenerator 和 policytools。
在启用 Fleet view 开关时，查看有关您的集群的更多信息。许多摘要卡被重新设计，如集群、应用程序类型、策略以及节点卡。此外，还提供了两个新的摘要卡，如 集群版本和 Worker 内核计数。请参阅产品控制台中概述卡的大量更改。
现在，您可以使用选择导出按钮在 CSV 文件中导出数据。请参阅访问您的控制台。
现在，您可以从控制台和搜索结果查看虚拟机资源。配置虚拟机资源的操作。请参阅启用虚拟机操作（技术预览）。

如需更多信息，请参阅在控制台中搜索。

1.1.4. Clusters
复制链接

现在，您可以启用并使用 SiteConfig operator 作为模板驱动的集群置备解决方案，它允许您使用所有可用安装方法置备集群。参阅 SiteConfig 了解更多有关 SiteConfig 操作器的信息。

查看其他集群生命周期任务并支持带有多集群引擎 operator 的集群生命周期信息。

1.1.5. 多集群全局 hub
复制链接

现在，您可以通过在托管模式下导入受管 hub 集群，在受管 hub 集群上启用 local-cluster。请参阅在托管模式中导入受管 hub 集群（技术预览）。
有关其他多集群全局 hub 主题，请参阅多集群全局 hub。

1.1.6. 应用程序
复制链接

现在，您可以使用 Red Hat Advanced Cluster Management GitOpsCluster 将非 OpenShift Container Platform 集群注册到 Red Hat OpenShift GitOps 集群，为您提供更多方法来部署应用程序。如需更多信息，请参阅：将非 OpenShift Container Platform 集群注册到 Red Hat OpenShift GitOps。

有关其他应用程序主题，请参阅管理应用程序。

1.1.7. Observability（可观察性）
复制链接

要获得默认设置的环境稳定性，默认的 CPU 请求增加到 500m，并且对 thanos-compact pod 的内存请求增加到 1024Mi。如需了解更多详细信息，请参阅 Observability pod 容量请求。
要创建 secret 并将其挂载到 alertmanager pod 以访问任意内容，您可以在 MultiClusterObservability 资源中添加内容。请参阅在 Alertmanager pod 中挂载 secret。
Grafana 更新至 11.1.5 版本。请参阅使用 Grafana 仪表板。
现在，您可以选择 Advanced search 下拉菜单来在控制台中使用 Advanced search 选项。指定查询并接收与您输入和基于范围的搜索参数完全匹配的结果。请参阅搜索自定义和配置。
技术预览 ：使用 ObservabilityAddOn 自定义资源定义中的新 worker 参数将更多 worker 节点添加到指标收集器 procress 中，以划分向 hub 集群发出的请求。请参阅扩展指标集合（技术预览）。

请参阅 Observability 服务简介。

1.1.8. 监管
复制链接

要根据可用的节点角色配置集群，现在可以使用 getNodesWithExactRoles 功能接收节点列表，并使用 hasNodesWithExactRoles 功能接收只包含您指定的角色的集群确认。如需了解更多详细信息，请参阅模板功能。
现在，您可以通过配置 ArgoCD 资源来为资源类型定义额外的健康检查和自定义状态信息。如需更多信息，请参阅 Red Hat OpenShift GitOps 中的配置策略健康检查。
要在配置策略中为合规信息添加更清晰的信息，您现在可以使用 spec.customMessage 字段自定义合规性信息。请参阅 Kubernetes 配置策略控制器。
您可以使用 .PolicyMetadata hub 集群模板变量来访问 root 策略的元数据。请参阅 hub 集群和受管集群模板的比较。
现在，您可以使用 hubTemplateOptions.serviceAccountName 字段指定服务帐户来扩展和控制所有 hub 集群模板查找的访问。请参阅 hub 集群和受管集群模板的比较。
要在 Gatekeeper operator 中指定 containerArguments，请提供传递给容器的参数和值列表。请参阅 Gatekeeper 自定义资源示例。
spec.evaluationInterval.compliant 和 spec.evaluationInterval.noncompliant 的默认值为 watch，因此您可以使用 Kubernetes API 监视而不是轮询 Kubernetes API 服务器。如需更多信息，请参阅配置策略 YAML 表。
使用新的命令行工具，您可以下载 PolicyGenerator，以通过 Kubernetes 清单中使用 Kustomize 生成策略。您还可以使用带有 template-resolver 子命令的 policytools 来在本地解析模板。请参阅策略生成器以了解更多有关策略生成器的信息。如需有关 policytools 的详情，请参阅策略命令行界面。
当您在受管集群中直接应用 Red Hat Advanced Cluster Management 策略和 Gatekeeper 约束时，您现在可以在控制台中在 Discovered policies 选项卡中查看策略部署。请参阅使用外部工具进行策略部署。

如需了解更多有关仪表板和策略框架的信息，请参阅监管。

1.1.9. 备份和恢复
复制链接

现在，您有一个可运行灾难恢复测试的情况。通过模拟灾难，您可以练习以下操作：在新 hub 集群上恢复 hub 集群数据，验证数据是否已恢复，并通过将主 hub 集群用作活跃 hub 集群来返回到初始 hub 集群。请参阅恢复后返回到初始 hub 集群。
现在，您可以使用 velero.io/backup-name: backupName 标签在恢复 hub 集群中标记用户创建的资源，将现有 hub 集群用作恢复 hub 集群。请参阅使用现有 hub 集群作为恢复 hub 集群和标记资源的限制。
现在，您可以通过在 MultiClusterHub 资源中设置注解来自定义 OADP 版本。请参阅安装自定义 OADP 版本。
现在，您可以临时暂停 BackupSchedule 资源，而不是删除它。通过在备份 hub 集群中使用 BackupSchedule paused 属性，您可以避免备份冲突。请参阅防止备份冲突。
现在，您可以在恢复操作过程中保持主 hub 集群活跃。请参阅在恢复过程中保持主 hub 集群处于活动状态。
使用 Red Hat Advanced Cluster Management 恢复资源，您可以设置更多 velero.io.restore spec 选项。请参阅使用其他恢复示例。

要了解 hub 集群的灾难恢复解决方案，请参阅备份和恢复。

1.1.10. 使用 Red Hat Advanced Cluster Management 集成的 multicluster engine operator
复制链接

如果您在使用独立多集群引擎 operator 后安装了 Red Hat Advanced Cluster Management，您可以访问所有 Red Hat Advanced Cluster Management 功能。

您可以从集群中部署的 MultiClusterHub 自定义资源启用 SiteConfig 组件。请参阅 MultiClusterHub 高级配置了解更多信息。参阅 SiteConfig 了解更多有关 SiteConfig 操作器的信息。

1.1.11. 了解有关此发行版本的更多信息
复制链接

欢迎使用 Red Hat Advanced Cluster Management for Kubernetes 包括了 Red Hat Advanced Cluster Management for Kubernetes 的概述。
请参阅 Red Hat Advanced Cluster Management 发行注记中的更多发行注记，如 已知问题和限制。
多集群架构包括了与该产品主要组件相关的详细信息。
请参阅 Red Hat Advanced Cluster Management 故障排除指南中的支持信息和更多信息。
访问开源的 Open Cluster Management 存储库，以获取开源社区的交互、增长和贡献。要参与，请参阅 open-cluster-management.io。如需更多信息，请访问 GitHub 存储库。

1.2. Red Hat Advanced Cluster Management 的勘误更新
复制链接

默认情况下，勘误更新会在发布时自动应用。当发行版本可用时，会在此处发布详情。如果没有列出发行注记，则该产品目前没有勘误版本。

重要： 为了便于参考，JIRA 链接和 JIRA 号可能会添加到内容中并在内部使用。用户可能不能使用访问的链接。

有关升级的更多信息，请参阅使用 operator 升级。

1.2.3. Errata 2.12.3
复制链接

为一个或多个产品容器镜像提供更新。
修复策略具有无效结构导致的控制台错误。(ACM-16238)
当集群导入到 Red Hat Advanced Cluster Management 时，将正确的 OpenShift Container Platform 版本保存到数据库。(ACM-17553)
允许对带有签名证书的远程集群的虚拟机操作。(ACM-17065)
即使 ClusterInstance 从集群管理 hub 中删除，也会保留节点对象。(ACM-17877)
防止同一指标获得多次报告，并通过报告指标一次性报告带有违反情况的 OpenShift Container Platform 模板的数量来触发 PrometheusDuplicateTimestamps 警报。(ACM-16014)
当收集器从 hub 集群接收 HTTP 409 错误代码时，阻止指标收集器降级 addon 状态，这会正确加载指标示例并从有效负载拒绝重复。(ACM-16493)
更正 ACMRemoteWriteError 警报，以便在远程写入有 20% 错误率时准确报告。(ACM-18000)

1.2.4. Errata 2.12.2
复制链接

为一个或多个产品容器镜像提供更新。
如果无法从 镜像流 中找到镜像的 Red Hat Advanced Cluster Management 2.12 版本，请确保 observability operator 无法协调。(ACM-15525)
配置 alertmanager 高可用性(HA)，使 Prometheus 将请求发送到所有 alertmanagers。(ACM-16211)
删除 observability-observatorium-operator 的部署，并重新创建紧凑的 statefulset。(ACM-14867)
在协调循环中检查 serviceaccount 上的镜像 pull secret 是否存在，并通过不使用 search-pull-secret secret 的 serviceaccount 替换 serviceaccount 来更新 serviceaccount。(ACM-15056)
报告 OperatorPolicy 的现有订阅的状态。(ACM-15394)
更改系统，以便 InfraEnv 中指定的网络时间协议(NTP)服务器用作回退。(ACM-16163)
防止检查命名空间中用户权限的按钮在 Enabled 和 Disabled 状态之间有所变化。(ACM-16019)
检测 MultiClusterHub 是否进行了任何需要应用到容器镜像的更改。(ACM-16517)

1.2.5. Errata 2.12.1
复制链接

为一个或多个产品容器镜像提供更新。
修复 multicluster global hub 搜索 Operator，以便它可以启用 globalSearchFeatureFlag，即使 multicluster engine operator 目标命名空间不是默认值。(ACM-15075)
修复 OpenShift Data Foundation Operator，以便它可以使用 OperatorPolicy 安装以逗号分隔的值(CSV)。(ACM-14540)

1.3. Red Hat Advanced Cluster Management 的已知问题和限制
复制链接

检查应用程序管理的已知问题。以下列表包含本发行版本的已知问题，或从上一版本中继承的问题。

已知的与安装相关的问题
已知的业务连续问题
已知的控制台问题
已知的与集群管理相关的问题
已知的应用程序问题
已知的可观察性问题
已知的监管问题
已知的已知问题
全局 Hub 已知问题

重要： OpenShift Container Platform 发行注记没有包括在此文档中。对于 OpenShift Container Platform 集群，请参阅 OpenShift Container Platform 发行注记。

有关弃用和删除的更多信息，请参阅为 Red Hat Advanced Cluster Management 弃用和删除。

1.3.1. 已知的与安装相关的问题
复制链接

查看安装和升级的已知问题。以下列表包含本发行版本的已知问题，或从上一版本中继承的问题。

对于 Red Hat OpenShift Container Platform 集群，请参阅 OpenShift Container Platform 已知问题。

有关弃用和删除的更多信息，请参阅为 Red Hat Advanced Cluster Management 弃用和删除。

1.3.1.1. 使用 OpenShift Container Platform 4.18 升级现有 Red Hat Advanced Cluster Management 集群会导致安装 CRD 错误
复制链接

当您使用 OpenShift Container Platform 4.18 升级现有 Red Hat Advanced Cluster Management 2.12 集群时，您的升级会失败，并显示在 MultiClusterHub 自定义资源实例上安装 Observability 组件的错误。

注：这只适用于早于 Red Hat Advanced Cluster Management 2.12.2 的版本。如果您直接升级到 Red Hat Advanced Cluster Management 2.12.2，则不会收到这个错误。如果您首次使用 OpenShift Container Platform 4.18 安装 Red Hat Advanced Cluster Management 2.12，则不会收到这个错误。

要获取错误的详情，请运行以下命令：

oc get multiclusterhubs -n open-cluster-management -o yaml

hub 集群报告以下出错信息，显示安装 multiclusterobservabilities.observability.open-cluster-management.io 失败：

message: 'Error installing CRDs: CustomResourceDefinition.apiextensions.k8s.io
"multiclusterobservabilities.observability.open-cluster-management.io" is
invalid: spec.conversion.webhookClientConfig.caBundle: Invalid value: []byte{0x5c,0x6e}: unable to load root certificates: unable to parse bytes as PEM block'
 reason: FailedDeployingComponent
 status: "False"
 type: Progressing
desiredVersion: 2.12.0
phase: Installing

在 MultiClusterHub 自定义资源实例上 禁用 Observability 组件后，运行以下命令删除 Observabiliity crd ：
```
oc delete crd multiclusterobservabilities.observability.open-cluster-management.io
```
重要：
- 如果在集群中启用了 Observability 组件，则上一个命令会删除整个 Observability 堆栈。
- 启用 Observability 的升级不存在已知的临时解决方案。您可以完全卸载 Red Hat Advanced Cluster Management，并在没有这个失败的情况下重新安装任何 CRD。
- 如果您不想丢失 Observability 堆栈，请不要在 OpenShift Container Platform 4.18 中出现 Red Hat Advanced Cluster Management。

删除 Observability CRD 后，运行以下命令检查 Red Hat Advanced Cluster Management 升级的进度：

oc get multiclusterhubs -n open-cluster-management -o yaml

输出指出 hub 集群组件已就绪，如下例所示：

message: 'created new resource: CustomResourceDefinition multiclusterobservabilities.observability.open-cluster-management.io'
 reason: NewResourceCreated
 status: "True"
 type: Progressing
 message: All hub components ready.
 ...
 reason: ComponentsAvailable
 status: "True"
 type: Complete

1.3.1.2. 使用升级卸载和重新安装早期版本可能会失败
复制链接

如果您从 OpenShift Container Platform 卸载 Red Hat Advanced Cluster Management，如果您稍后想要安装早期版本，则会导致问题。例如，当卸载 Red Hat Advanced Cluster Management 时，安装早期版本的 Red Hat Advanced Cluster Management 和升级该版本，升级可能会失败。如果没有删除自定义资源，升级会失败。

在重新安装步骤前，按照清理工件以防止出现这个问题。

1.3.1.3. 带有 ARM 聚合流的基础架构 operator 错误
复制链接

安装 infrastructure-operator 时，与 ARM 的聚合流无法正常工作。将 ALLOW_CONVERGED_FLOW 设置为 false 来解决此问题。

运行以下命令来创建 ConfigMap 资源：
```
oc create -f
```

运行 oc apply -f 以应用您的文件。请参阅以下文件示例，并将 ALLOW_CONVERGED_FLOW 设置为 false ：

apiVersion: v1
kind: ConfigMap
metadata:
  name: my-assisted-service-config
  namespace: assisted-installer
data:
  ALLOW_CONVERGED_FLOW: false

使用以下命令注解 agentserviceconfig ：

oc annotate --overwrite AgentServiceConfig agent unsupported.agent-install.openshift.io/assisted-service-configmap=my-assisted-service-config

当问题解决时，代理会出现在清单中。

1.3.2. 已知的业务连续问题
复制链接

查看 Red Hat Advanced Cluster Management for Kubernetes 中的已知问题。以下列表包含本发行版本的已知问题，或从上一版本中继承的问题。

对于 Red Hat OpenShift Container Platform 集群，请参阅 OpenShift Container Platform 已知问题。

有关弃用和删除的更多信息，请参阅为 Red Hat Advanced Cluster Management 弃用和删除。

1.3.2.1. 备份和恢复已知问题
复制链接

此处列出了备份和恢复已知问题和限制，以及临时解决方案（如果可用）。

1.3.2.1.1. open-cluster-management-backup 命名空间处于 Terminating 状态
复制链接

当在 MultiClusterHub 资源中禁用 cluster-backup 组件时，如果 Red Hat Advanced Cluster Management 恢复操作创建了一个 Velero 恢复资源，则 open-cluster-management-backup 命名空间会处于 Terminating 状态。

Terminating 状态是在 restore. velero.io/external-resources-finalizer 上等待的 Velero 恢复资源完成的结果。要解决这个问题，请完成以下步骤：

删除所有 Red Hat Advanced Cluster Management 恢复资源，并在禁用 MultiClusterHub 资源上的集群备份选项前等待 Velero 恢复被清理。
如果您的 open-cluster-management-backup 命名空间已经处于 Terminating 状态，请编辑所有 Velero 恢复资源并删除终结器。
允许 Velero 资源删除命名空间和资源。

1.3.2.1.2. 裸机 hub 资源不再由受管集群备份备份
复制链接

如果使用 Red Hat Advanced Cluster Management 备份和恢复功能，裸机集群被备份并恢复到二级 hub 集群，则受管集群会在节点上重新安装，这会销毁现有的受管集群。

注：这只会影响使用零接触置备部署的裸机集群，这意味着它们具有管理打开和关闭裸机节点的 BareMetalHost 资源以及附加虚拟介质以进行引导。如果受管集群部署中没有使用 BareMetalHost 资源，则没有负面影响。

要临时解决这个问题，主 hub 集群上的 BareMetalHost 资源不再使用受管集群备份备份。

如果您有不同的用例，并且希望主 hub 集群上的受管 BareMetalHost 资源被备份，请将以下备份标签添加到主 hub 集群上的 BareMetalHost 资源中： cluster.open-cluster-management.io/backup。

要了解有关使用此备份标签备份通用资源的更多信息，请参阅备份的资源主题。

1.3.2.1.3. Velero 恢复限制
复制链接

如果在其中恢复数据的新 hub 集群有用户创建的资源，则这个新的 hub 集群可能会有与活跃的 hub 集群不同的配置。例如，在将备份的数据恢复到新的 hub 集群中之前，在这个新的 hub 集群上可能已包括了一个现存的策略。

如果不是恢复的备份的一部分，Velero 会跳过现存的资源，因此新 hub 集群上的策略不会改变，这会导致新 hub 集群和活跃 hub 集群之间的不同配置。

为解决这个问题，集群备份和恢复 Operator 可以运行一个恢复后的操作以清理由用户创建的资源，或在 restore.cluster.open-cluster-management.io 资源时执行不同的恢复操作。

如需更多信息，请参阅恢复主题后清理 hub 集群。

1.3.2.1.4. 被动配置不显示受管集群
复制链接

只有在被动 hub 集群上恢复激活数据时，才会显示受管集群。

1.3.2.1.5. 未恢复受管集群资源
复制链接

当您恢复 local-cluster 受管集群资源的设置并覆盖新 hub 集群中的 local-cluster 数据时，设置会被错误配置。上一个 hub 集群 local-cluster 的内容没有备份，因为资源包含 local-cluster 特定信息，如集群 URL 详情。

您必须在恢复集群中手动应用与 local-cluster 资源相关的配置更改。请参阅安装备份和恢复 Operator 主题中的 准备新 hub 集群。

1.3.2.1.6. 恢复的 Hive 受管集群可能无法与新的 hub 集群连接
复制链接

当您为 Hive 受管集群恢复更改或轮转颁发机构 (CA) 的备份时，受管集群将无法连接到新的 hub 集群。连接会失败，因为此受管集群的 admin kubeconfig secret 通过备份提供，所以不再有效。

您必须在新 hub 集群中手动更新受管集群的恢复的 admin kubeconfig secret。

1.3.2.1.7. 导入的受管集群显示 Pending Import 状态
复制链接

在主 hub 集群上手动导入的受管集群会在被动 hub 集群上恢复激活数据时显示一个 Pending Import 状态。如需更多信息，请参阅使用受管服务帐户连接集群。

1.3.2.1.8. 恢复 hub 集群后，appliedmanifestwork 不会被从受管集群中删除
复制链接

当在新 hub 集群上恢复 hub 集群数据时，appliedmanifestwork 不会从没有固定集群集的应用程序订阅的放置规则的受管集群中删除。

有关不是固定集群集的应用程序订阅，请参阅以下放置规则示例：

spec:
  clusterReplicas: 1
  clusterSelector:
    matchLabels:
      environment: dev

因此，当受管集群从恢复的 hub 集群分离时，应用程序会被孤立。

要避免这个问题，请在放置规则中指定固定的集群集。请参见以下示例：

spec:
  clusterSelector:
    matchLabels:
      environment: dev

您还可以通过运行以下命令来手动删除剩余的 appliedmanifestwork ：

oc delete appliedmanifestwork <the-left-appliedmanifestwork-name>

1.3.2.1.9. 应用的manifestwork 不会被删除，规格中缺少 agentID
复制链接

当您将 Red Hat Advanced Cluster Management 2.6 用作主 hub 集群时，但您的恢复 hub 集群位于 2.7 或更高版本的版本时，appliedmanifestworks 规格中缺少 agentID，因为此字段在 2.7 发行版本中引入。这会为受管集群上的主 hub 生成额外的 appliedmanifestworks。

要避免这个问题，请将主 hub 集群升级到 Red Hat Advanced Cluster Management 2.7，然后在新的 hub 集群中恢复备份。

通过为每个 appliedmanifestwork 手动设置 spec.agentID 来修复受管集群。

运行以下命令来获取 agentID ：

oc get klusterlet klusterlet -o jsonpath='{.metadata.uid}'

运行以下命令，为每个 appliedmanifestwork 设置 spec.agentID ：

oc patch appliedmanifestwork <appliedmanifestwork_name> --type=merge -p '{"spec":{"agentID": "'$AGENT_ID'"}}'

1.3.2.1.10. managed-serviceaccount add-on 状态显示 Unknown
复制链接

如果您使用 Managed Service Account，则受管集群 appliedmanifestwork addon-managed-serviceaccount-deploy 会从导入的受管集群中删除，而无需在新 hub 集群的 multicluster engine for Kubernetes operator 资源中启用它。

受管集群仍然导入到新的 hub 集群，但 managed-serviceaccount add-on 状态显示 Unknown。

在 multicluster engine operator 资源中启用 Managed Service Account 后，您可以恢复 managed-serviceaccount 附加组件。请参阅启用自动导入以了解如何启用受管服务帐户。

1.3.2.2. VolSync 已知问题
复制链接

1.3.2.2.1. 删除附加组件时，手动删除受管集群上所需的 VolSync CSV
复制链接

当您从 hub 集群中删除 VolSync ManagedClusterAddOn 时，它会删除受管集群上的 VolSync operator 订阅，但不会删除集群服务版本(CSV)。要从受管集群中删除 CSV，请在您要删除 VolSync 的每个受管集群中运行以下命令：

oc delete csv -n openshift-operators volsync-product.v0.6.0

1.3.2.2.2. 使用自定义 CA 证书恢复到其恢复的 hub 集群连接可能会失败
复制链接

恢复管理使用自定义 CA 证书的 hub 集群的备份后，受管集群和 hub 集群之间的连接可能会失败。这是因为在恢复的 hub 集群上没有备份 CA 证书。要恢复连接，将受管集群的命名空间中自定义 CA 证书信息复制到恢复的 hub 集群上的 <managed_cluster>-admin-kubeconfig secret。

注：如果您在创建备份副本前将此 CA 证书复制到 hub 集群，备份副本会包括 secret 信息。当您使用备份副本来恢复时，hub 集群和受管集群之间的连接会自动完成。

1.3.3. 已知的控制台问题
复制链接

查看控制台的已知问题。以下列表包含本发行版本的已知问题，或从上一版本中继承的问题。

对于 Red Hat OpenShift Container Platform 集群，请参阅 OpenShift Container Platform 已知问题。

有关弃用和删除的更多信息，请参阅为 Red Hat Advanced Cluster Management 弃用和删除。

1.3.3.1. 无法在控制台中升级 OpenShift Dedicated
复制链接

在控制台中，您可以为 OpenShift Dedicated 集群请求升级，但升级会失败，并显示 Cannot upgrade non openshift cluster 错误消息。目前没有临时解决方案。

1.3.3.2. 搜索 PostgreSQL pod 处于 CrashLoopBackoff 状态
复制链接

search-postgres pod 处于 CrashLoopBackoff 状态。如果 Red Hat Advanced Cluster Management 部署到启用了 hugepages 参数的节点，并且 search-postgres pod 调度到这些节点中，则 pod 不会启动。

完成以下步骤以增加 search-postgres pod 的内存：

使用以下命令暂停 search-operator pod：

oc annotate search search-v2-operator search-pause=true

使用 hugepages 参数的限制来更新 search-postgres 部署。运行以下命令，将 hugepages 参数设置为 512Mi ：

oc patch deployment search-postgres --type json -p '[{"op": "add", "path": "/spec/template/spec/containers/0/resources/limits/hugepages-2Mi", "value":"512Mi"}]'

在验证 pod 的内存用量前，请确保您的 search-postgres pod 处于 Running 状态。运行以下命令:
```
oc get pod <your-postgres-pod-name>  -o jsonpath="Status: {.status.phase}"
```

运行以下命令，以验证 search-postgres pod 的内存用量：

oc get pod <your-postgres-pod-name> -o jsonpath='{.spec.containers[0].resources.limits.hugepages-2Mi}'

出现以下值 512Mi。

1.3.3.3. 无法编辑集群集的命名空间绑定
复制链接

当使用 admin 角色或 bind 角色编辑集群集的命名空间绑定时，您可能会遇到类似以下消息的错误：

ResourceError: managedclustersetbindings.cluster.open-cluster-management.io "<cluster-set>" is forbidden: User "<user>" cannot create/delete resource "managedclustersetbindings" in API group "cluster.open-cluster-management.io" in the namespace "<namespace>".

要解决这个问题，请确保还有权在您要绑定的命名空间中创建或删除 ManagedClusterSetBinding 资源。角色绑定只允许将集群集绑定到命名空间。

1.3.3.4. 在置备托管的 control plane 集群后，水平滚动无法正常工作
复制链接

置备托管的 control plane 集群后，如果 ClusterVersionUpgradeable 参数太长，您可能无法在 Red Hat Advanced Cluster Management 控制台的集群概述中水平滚动。因此，您无法查看隐藏的数据。

要临时解决这个问题，请使用浏览器缩放控制来缩放，增加 Red Hat Advanced Cluster Management 控制台窗口大小，或者复制文本并将其粘贴到不同的位置。

1.3.3.5. EditApplicationSet 扩展功能重复
复制链接

当您添加多个标签表达式或尝试为 ApplicationSet 输入集群选择器时，您可能会重复收到以下信息，"Expand to enter expression"。尽管出现这个问题，您可以输入集群选择。

1.3.3.6. 无法从 Red Hat Advanced Cluster Management 注销
复制链接

当您使用外部身份提供程序登录到 Red Hat Advanced Cluster Management 时，您可能无法从 Red Hat Advanced Cluster Management 注销。当您使用与 IBM Cloud 和 Keycloak 作为身份提供程序一起安装的 Red Hat Advanced Cluster Management 时会出现这种情况。

在尝试从 Red Hat Advanced Cluster Management 注销前，您必须从外部身份提供程序注销。

1.3.3.7. 在 OpenShift Cloud Manager 控制台中输入 cluster-ID 的问题
复制链接

如果您没有在 OpenShift Cloud Manager 控制台中访问 cluster-ID，您仍然可以从终端获取 OpenShift Service on AWS cluster-ID 的描述。您需要 OpenShift Service on AWS 命令行界面。请参阅 AWS CLI 文档中的 OpenShift Service 入门文档。

要获取 cluster-ID，请从 OpenShift Service on AWS 命令行界面运行以下命令：

rosa describe cluster --cluster=<cluster-name> | grep -o ’^ID:.*

1.3.4. 已知的与集群管理相关的问题和限制
复制链接

查看 Red Hat Advanced Cluster Management 进行集群管理的已知问题。以下列表包含本发行版本的已知问题和限制，或已知问题。

有关 Kubernetes Operator 的多集群引擎的集群生命周期，请参阅 multicluster engine operator 文档中的集群生命周期已知问题和限制。

1.3.4.1. hub 集群通信限制
复制链接

如果 hub 集群无法访问或与受管集群通信，则会出现以下限制：

您不能使用控制台创建新的受管集群。您仍然可以使用命令行界面或使用控制台中的 手动运行 import 命令 导入受管集群。
如果您使用控制台部署 Application 或 ApplicationSet，或者您将受管集群导入到 ArgoCD 中，hub 集群 ArgoCD 控制器会调用受管集群 API 服务器。您可以使用 AppSub 或 ArgoCD pull 模型来解决这个问题。
pod 日志的控制台页面无法正常工作，并显示类似如下的错误消息：
```
Error querying resource logs:
Service unavailable
```

1.3.4.2. local-cluster 可能无法自动重新创建
复制链接

如果在 disableHubSelfManagement 被设置为 false 时删除 local-cluster，则 MulticlusterHub operator 会重新创建 local-cluster。分离 local-cluster 后，可能不会自动重新创建 local-cluster。

要解决这个问题，修改由 MulticlusterHub operator 监控的资源。请参见以下示例：
```
oc delete deployment multiclusterhub-repo -n <namespace>
```
要正确分离 local-cluster，在 MultiClusterHub 中将 disableHubSelfManagement 设置为 true。

1.3.4.3. 使用不同名称重新导入后 local-cluster 状态为离线
复制链接

当您意外尝试以不同名称的集群形式重新导入名为 local-cluster 的集群时，local-cluster 和重新导入的集群的状态将 离线。

要从这个问题单中恢复，请完成以下步骤：

在 hub 集群中运行以下命令，以临时编辑 hub 集群的自助管理设置：
```
oc edit mch -n open-cluster-management multiclusterhub
```
添加 spec.disableSelfManagement=true 设置。
在 hub 集群中运行以下命令以删除并重新部署 local-cluster：
```
oc delete managedcluster local-cluster
```

输入以下命令删除 local-cluster 管理设置：

oc edit mch -n open-cluster-management multiclusterhub

删除之前添加的 spec.disableSelfManagement=true。

1.3.4.4. hub 集群和受管集群的时钟未同步
复制链接

hub 集群和管理集群的时间可能会不同步，在控制台中显示 unknown，当在几分钟内会变为 available。确保正确配置了 OpenShift Container Platform hub 集群时间。请参阅自定义节点。

1.3.5. 已知的与应用程序相关的问题和限制
复制链接

检查应用程序管理的已知问题。以下列表包含本发行版本的已知问题，或从上一版本中继承的问题。

对于 Red Hat OpenShift Container Platform 集群，请参阅 OpenShift Container Platform 已知问题。

有关弃用和删除的更多信息，请参阅为 Red Hat Advanced Cluster Management 弃用和删除。

请参阅以下对应用程序生命周期组件的已知问题。

1.3.5.1. 应用程序拓扑显示无效的表达式
复制链接

当您在 Placement 资源中使用 Exist 或 DoesNotExist 运算符时，应用程序拓扑节点详情会将表达式显示为 #invalidExpr。此显示错误，表达式仍然有效，且在 放置资源 中工作。要解决这个问题，请编辑 放置资源 YAML 中的表达式。

1.3.5.2. 使用 PlacementRule 编辑订阅应用程序不会在编辑器中显示订阅 YAML
复制链接

创建引用 PlacementRule 资源的订阅应用程序后，控制台中的 YAML 编辑器不会显示订阅 YAML。使用您的终端编辑订阅 YAML 文件。

1.3.5.3. 带有 secret 依赖项的 Helm Chart 无法由 Red Hat Advanced Cluster Management 订阅部署
复制链接

使用 Helm Chart，您可以在 Kubernetes secret 中定义隐私数据，并在 Helm Chart 的 value.yaml 文件中定义此 secret。

用户名和密码由引用的 Kubernetes secret 资源 dbsecret 提供。例如，请参阅以下示例 value.yaml 文件：

credentials:
  secretName: dbsecret
  usernameSecretKey: username
  passwordSecretKey: password

只有在 Helm 二进制 CLI 中才支持带有 secret 依赖项的 Helm Chart。Operator SDK Helm 库不支持它。Red Hat Advanced Cluster Management 订阅控制器应用 operator SDK Helm 库来安装和升级 Helm Chart。因此，Red Hat Advanced Cluster Management 订阅无法使用 secret 依赖项部署 Helm Chart。

1.3.5.4. 拓扑无法正确显示 Argo CD pull 模型 ApplicationSet 应用程序
复制链接

当您使用 Argo CD pull 模型来部署 ApplicationSet 应用程序，且应用程序资源名称会被自定义时，每个集群的资源名称可能会有所不同。当发生这种情况时，拓扑无法正确显示您的应用程序。

1.3.5.5. 本地集群被排除为拉取模型的受管集群
复制链接

hub 集群应用程序集部署到目标受管集群，但本地集群（一个受管 hub 集群）作为目标受管集群排除。

因此，如果 Argo CD pull 模型将 Argo CD 应用程序传播到本地集群，则不会清理本地集群 Argo CD 应用程序，即使本地集群已从 Argo CD ApplicationSet 资源的放置决定中删除。

要临时解决这个问题并清理本地集群 Argo CD 应用程序，请从本地集群 Argo CD 应用程序中删除 skip-reconcile 注解。请参阅以下注解：

annotations:
    argocd.argoproj.io/skip-reconcile: "true"

另外，如果您在 Argo CD 控制台的 Applications 部分手动刷新 pull model Argo CD 应用程序，则不会处理刷新，并且 Argo CD 控制台中的 REFRESH 按钮被禁用。

要临时解决这个问题，请从 Argo CD 应用程序中删除 refresh 注解。请参阅以下注解：

annotations:
    argocd.argoproj.io/refresh: normal

1.3.5.6. Argo CD 控制器和传播控制器可能会同时协调
复制链接

Argo CD 控制器和传播控制器可能会在同一应用程序资源上协调，并导致受管集群中应用程序部署的重复实例，但来自不同部署模型。

对于使用 pull 模型部署应用程序，当 Argo CD argocd.argoproj.io/skip-reconcile 注解添加到 ApplicationSet 的 template 部分时，Argo CD 控制器会忽略这些应用程序资源。

argocd.argoproj.io/skip-reconcile 注解仅适用于 GitOps operator 版本 1.9.0 或更高版本。为防止冲突，请等待 hub 集群和所有受管集群都升级到 GitOps operator 版本 1.9.0，然后再实施 pull 模型。

1.3.5.7. 资源无法部署
复制链接

MulticlusterApplicationSetReport 中列出的所有资源实际上都部署到受管集群中。如果资源无法部署，则资源不包含在资源列表中，但原因会在错误消息中列出。

1.3.5.8. 资源分配可能需要几分钟时间
复制链接

对于超过 1000 个受管集群和 Argo CD 应用程序集的大型环境，部署到数百个受管集群，hub 集群上的 Argo CD 应用程序创建可能需要几分钟时间。您可以在应用程序集的 clusterDecisionResource 生成器中将 requeueAfterSeconds 设置为 zero，如下例所示：

apiVersion: argoproj.io/v1alpha1
kind: ApplicationSet
metadata:
  name: cm-allclusters-app-set
  namespace: openshift-gitops
spec:
  generators:
  - clusterDecisionResource:
      configMapRef: ocm-placement-generator
      labelSelector:
        matchLabels:
          cluster.open-cluster-management.io/placement: app-placement
      requeueAfterSeconds: 0

1.3.5.9. 应用程序 ObjectBucket 频道类型无法使用 allow 和 deny 列表
复制链接

您不能在 subscription-admin 角色中使用 ObjectBucket 频道类型指定 allow 和 deny 列表。在其他频道类型中，订阅中的 allow 和 deny 列表表示可以部署哪些 Kubernetes 资源，以及不应部署哪些 Kubernetes 资源。

1.3.5.9.1. Argo Application 无法部署到 3.x OpenShift Container Platform 受管集群
复制链接

控制台中的 Argo ApplicationSet 无法部署到 3.x OpenShift Container Platform 受管集群，因为 Infrastructure.config.openshift.io API 在 3.x 上不可用。

1.3.5.10. 对 multicluster_operators_subscription 镜像的更改不会自动生效
复制链接

在受管集群中运行的 application-manager 附加组件现在由 subscription operator 处理，后者之前由 klusterlet operator 处理。订阅 operator 没有管理 multicluster-hub，因此对 multicluster-hub 镜像清单 ConfigMap 中的 multicluster_operators_subscription 镜像的更改不会自动生效。

如果订阅 operator 使用的镜像通过更改 multicluster-hub 镜像清单 ConfigMap 中的 multicluster_operators_subscription 镜像覆盖，则受管集群中的 application-manager add-on 不会使用新镜像，直到订阅 operator pod 重启为止。您需要重启 pod。

1.3.5.11. 除非根据订阅管理员部署策略资源
复制链接

对于 Red Hat Advanced Cluster Management 版本 2.4，默认情况下，policy.open-cluster-management.io/v1 资源不再被应用程序订阅部署。

订阅管理员需要部署应用程序订阅以更改此默认行为。

如需更多信息，请参阅以订阅管理员身份创建允许和拒绝列表。在之前的 Red Hat Advanced Cluster Management 版本中，由现有应用程序订阅部署的 policy.open-cluster-management.io/v1 资源仍然保留，除非应用程序订阅由订阅管理员部署。

1.3.5.12. 应用程序 Ansible hook 独立模式
复制链接

不支持 Ansible hook 独立模式。要使用订阅在 hub 集群上部署 Ansible hook，您可以使用以下订阅 YAML：

apiVersion: apps.open-cluster-management.io/v1
kind: Subscription
metadata:
  name: sub-rhacm-gitops-demo
  namespace: hello-openshift
annotations:
  apps.open-cluster-management.io/github-path: myapp
  apps.open-cluster-management.io/github-branch: master
spec:
  hooksecretref:
      name: toweraccess
  channel: rhacm-gitops-demo/ch-rhacm-gitops-demo
  placement:
     local: true

但是，此配置可能永远不会创建 Ansible 实例，因为 spec.placement.local:true 有以 standalone 模式运行的订阅。您需要在 hub 模式中创建订阅。

创建部署到 local-cluster 的放置规则。请参阅以下示例，其中 local-cluster: "true" 代表 hub 集群：

apiVersion: apps.open-cluster-management.io/v1
kind: PlacementRule
metadata:
  name: <towhichcluster>
  namespace: hello-openshift
spec:
  clusterSelector:
    matchLabels:
      local-cluster: "true"

在您的订阅中引用该放置规则。请参见以下示例：

apiVersion: apps.open-cluster-management.io/v1
kind: Subscription
metadata:
  name: sub-rhacm-gitops-demo
  namespace: hello-openshift
annotations:
  apps.open-cluster-management.io/github-path: myapp
  apps.open-cluster-management.io/github-branch: master
spec:
  hooksecretref:
      name: toweraccess
  channel: rhacm-gitops-demo/ch-rhacm-gitops-demo
  placement:
     placementRef:
        name: <towhichcluster>
        kind: PlacementRule

应用两者后，您应该看到 hub 集群中创建的 Ansible 实例。

1.3.5.13. 在更新的放置规则后没有部署应用程序
复制链接

如果应用程序在更新放置规则后没有部署，请验证 application-manager pod 是否正在运行。application-manager 是需要在受管集群上运行的订阅容器。

您可以运行 oc get pods -n open-cluster-management-agent-addon |grep application-manager 来验证。

您还可以在控制台中搜索 kind:pod cluster:yourcluster 来查看 application-manager 是否在运行。

如果无法验证，请尝试再次导入集群并重新验证。

1.3.5.14. Subscription operator 不会创建一个 SCC
复制链接

了解 Red Hat OpenShift Container Platform SCC，请参阅管理安全性上下文约束，这是受管集群所需的额外配置。

不同的部署有不同的安全性上下文和不同的服务帐户。订阅 operator 无法自动创建 SCC CR。pod 的管理员控制权限。需要一个安全性上下文约束（SCC）CR，以便为相关服务帐户启用适当的权限，以便在非默认命名空间中创建 pod。要手动在命名空间中创建 SCC CR，完成以下操作：

找到在部署中定义的服务帐户。例如，查看以下 nginx 部署：
```
nginx-ingress-52edb
nginx-ingress-52edb-backend
```

在命名空间中创建 SCC CR 为服务帐户或帐户分配所需的权限。请参见以下示例，其中添加了 kind: SecurityContextConstraints ：

apiVersion: security.openshift.io/v1
 defaultAddCapabilities:
 kind: SecurityContextConstraints
 metadata:
   name: ingress-nginx
   namespace: ns-sub-1
 priority: null
 readOnlyRootFilesystem: false
 requiredDropCapabilities:
 fsGroup:
   type: RunAsAny
 runAsUser:
   type: RunAsAny
 seLinuxContext:
   type: RunAsAny
 users:
 - system:serviceaccount:my-operator:nginx-ingress-52edb
 - system:serviceaccount:my-operator:nginx-ingress-52edb-backend

1.3.5.15. 应用程序频道需要唯一的命名空间
复制链接

在同一命名空间中创建多个频道可能会导致 hub 集群出现错误。

例如，安装程序将命名空间 charts-v1 作为 Helm 类型频道使用，因此不要在 charts-v1 中创建任何其他频道。确保您在唯一命名空间中创建频道。所有频道需要单独的命名空间，但 GitHub 频道除外，它们可与另一个 GitHub 频道共享命名空间。

1.3.5.16. Ansible Automation Platform 作业失败
复制链接

当您选择不兼容的选项时，Ansible 作业无法运行。只有选择了 -cluster 范围内的频道选项时，Ansible Automation Platform 才起作用。这会影响需要执行 Ansible 作业的所有组件。

1.3.5.17. Ansible Automation Platform operator 在代理外访问 Ansible Automation Platform
复制链接

Red Hat Ansible Automation Platform Operator 无法访问启用了代理的 OpenShift Container Platform 集群之外的 Ansible Automation Platform。要解决这个问题，您可以在代理中安装 Ansible Automation Platform。请参阅 Ansible Automation Platform 提供的安装步骤。

1.3.5.18. 应用程序名称要求
复制链接

应用程序名称不能超过 37 个字符。如果字符超过这个数量，应用部署将显示以下错误。

status:
  phase: PropagationFailed
  reason: 'Deployable.apps.open-cluster-management.io "_long_lengthy_name_" is invalid: metadata.labels: Invalid value: "_long_lengthy_name_": must be no more than 63 characters/n'

1.3.5.19. 应用程序控制台表限制
复制链接

参阅控制台中不同 Application 表的限制：

在 Overview 页面的 Applications 表和 Advanced 配置页面上的 Subscriptions 表中，Clusters 列会显示部署应用程序资源的集群计数。因为应用程序是由本地集群上的资源定义的，所以本地集群会包含在搜索结果中，无论实际的应用程序资源是否在本地集群中部署。
在 Subscriptions 的 Advanced configuration 列表中，Applications 栏显示使用该订阅的应用程序总数，如果订阅部署了子应用程序，它们也会包含在搜索结果中。
Channels 的 Advanced configuration 列表中，Subscriptions 栏显示使用该频道的本地集群中的订阅总数，但这不包括由其他订阅部署的订阅，这些订阅包含在搜索结果中。

1.3.5.20. 没有应用程序控制台拓扑过滤
复制链接

2.12 的应用程序的 Console 和 Topology 已更改。控制台 Topology 页面中没有过滤功能。

1.3.5.21. 允许和拒绝列表在对象存储应用程序中无法正常工作
复制链接

允许和决绝列表功能无法在对象存储应用程序订阅中工作。

1.3.6. 已知的可观察性问题
复制链接

查看 Red Hat Advanced Cluster Management for Kubernetes 中的已知问题。以下列表包含本发行版本的已知问题，或从上一版本中继承的问题。

对于 Red Hat OpenShift Container Platform 集群，请参阅 link:https://docs.redhat.com/documentation/en-us/openshift_container_platform/4.15/html/release_notes#ocp-4-15-known-issues [OpenShift Container Platform known issues]。

有关弃用和删除的更多信息，请参阅为 Red Hat Advanced Cluster Management 弃用和删除。

1.3.6.1. 缺少 Grafana 仪表板
复制链接

运行 Grafana 实例后，Grafana 仪表板可能无法加载。完成以下步骤：

要验证仪表板是否无法加载，请运行以下命令检查日志：

oc logs observability-grafana-68f8489659-m79rv -c grafana-dashboard-loader -n open-cluster-management-observability
...
E1017 12:55:24.532493 1 dashboard_controller.go:147] dashboard: sample-dashboard could not be created after retrying 40 times

要修复仪表板失败，请通过将副本数扩展到 0 来重新部署 Grafana。multicluster-observability-operator pod 会自动将部署扩展到 MultiClusterObservability 资源中定义的所需副本数。运行以下命令:
```
oc scale deployment observability-grafana -n open-cluster-management-observability --replicas=0
```

要验证仪表板是否在红色正确加载，请运行以下命令来检查所有 Grafana pod 的日志，并确保没有错误消息：

oc logs observability-grafana-68f8489659-h6jd9 -c grafana-dashboard-loader -n open-cluster-management-observability | grep "could not be created"

1.3.6.2. 保留更改会导致数据丢失
复制链接

保留所有分辨率级别的默认保留（如 retentionResolutionRaw、retentionResolution5m 或 retentionResolution1h ）是 365 天(365d)。此 365d 默认保留意味着 1 小时分辨率的默认保留已从 0d 缩短为 365d。此保留更改可能会导致您丢失数据。如果您没有在 MultiClusterObservability spec.advanced.retentionConfig 参数中为解析保留设置显式值，则可能会丢失数据。

如需更多信息，请参阅为保留添加高级配置。

1.3.6.3. 恢复 hub 集群中的 observatorium API 网关 pod 可能具有过时的租户数据
复制链接

恢复 hub 集群中的 Observatorium API 网关 pod 可能会在备份和恢复过程后包含过时的租户数据，因为 Kubernetes 的限制。有关限制的更多信息，请参阅自动挂载的 ConfigMap。

因此，Observatorium API 和 Thanos 网关拒绝来自收集器的指标，Red Hat Advanced Cluster Management Grafana 仪表板不会显示数据。

请参阅 Observatorium API 网关 pod 日志中的以下错误：

level=error name=observatorium caller=logchannel.go:129 msg="failed to forward metrics" returncode="500 Internal Server Error" response="no matching hashring to handle tenant\n"

Thanos 接收带有以下错误的 pod 日志：

caller=handler.go:551 level=error component=receive component=receive-handler tenant=xxxx err="no matching hashring to handle tenant" msg="internal server error"

请参阅以下流程来解决这个问题：

将 observability-observatorium-api 部署实例从 N 缩减为 0。
将 observability-observatorium-api 部署实例从 0 扩展到 N。

注意： 默认情况下 N = 2，但在某些自定义配置环境中可能会大于 2。

这会使用正确的租户信息重启所有 Observatorium API 网关 pod，在 5 到 10 分钟后，来自收集器的数据也会在 Grafana 中显示。

1.3.6.4. 在 openshift-monitoring 命名空间中添加 PrometheusRules 和 ServiceMonitor 的权限
复制链接

从 Red Hat Advanced Cluster Management 2.9 开始，您必须使用定义的 Red Hat Advanced Cluster Management hub 集群命名空间中的标签。标签 openshift.io/cluster-monitoring: "true" 会导致 Cluster Monitoring Operator 提取指标的命名空间。

当部署 Red Hat Advanced Cluster Management 2.9 或安装升级到 2.9 时，Red Hat Advanced Cluster Management Observability ServiceMonitor 和 PrometheusRule 资源不再存在于 openshift-monitoring 命名空间中。

1.3.6.5. 缺少对代理设置的支持
复制链接

observability 附加组件的 Prometheus AdditionalAlertManagerConfig 资源不支持代理设置。您必须禁用 observability 警报转发功能。

完成以下步骤以禁用警报转发：

进入 MultiClusterObservability 资源。
将 mco-disabling-alerting 参数值更新为 true

不支持带有自签名 CA 证书的 HTTPS 代理。

1.3.6.6. Service-level Overview 仪表板上重复的 local-clusters
复制链接

当各种 hub 集群使用相同的 S3 存储部署 Red Hat Advanced Cluster Management observability 时，可以在 Kubernetes/Service-Level Overview/API Server 仪表板中检测并显示重复的 local-clusters。重复的集群在以下面板中影响结果： Top Clusters、超过 SLO 的集群数，以及满足 SLO 的集群数量。local-clusters 是与共享 S3 存储关联的唯一集群。要防止多个 local-clusters 显示在仪表板中，建议每个唯一的 hub 集群使用针对 hub 集群的 S3 存储桶来部署可观察性。

1.3.6.7. Observability endpoint operator 无法拉取镜像
复制链接

如果您创建一个 pull-secret 用于部署到 MultiClusterObservability CustomResource（CR），且 open-cluster-management-observability 命名空间中没有 pull-secret，则 observability endpoint operator 会失败。当您导入新集群或导入使用 Red Hat Advanced Cluster Management 创建的 Hive 集群时，需要在受管集群上手动创建 pull-image secret。

如需更多信息，请参阅启用可观察性。

1.3.6.8. 没有来自 ROKS 集群的数据
复制链接

Red Hat Advanced Cluster Management observability 不会在内置仪表板中显示 ROKS 集群中的数据。这是因为 ROKS 不会从它们管理的服务器公开任何 API 服务器指标。以下 Grafana 仪表板包含不支持 ROKS 集群的面板：Kubernetes/API server、Kubernetes/Compute Resources/Workload、Kubernetes/Compute Resources/Namespace(Workload)

1.3.6.9. ROKS 集群没有 etcd 数据
复制链接

对于 ROKS 集群，Red Hat Advanced Cluster Management observability 不会在仪表板的 etcd 面板中显示数据。

1.3.6.10. Grafana 控制台中没有指标数据
复制链接

注解查询在 Grafana 控制台中会失败：
当在 Grafana 控制台中搜索特定注解时，您可能会因为已过期的令牌收到以下错误消息：
"Annotation Query Failed"
重新刷新浏览器，验证您是否已登录到 hub 集群。
rbac-query-proxy pod 中的错误：
由于未授权访问 managedcluster 资源，您可能会在查询集群或项目时收到以下错误：
no project or cluster found
检查角色权限并进行相应的更新。如需更多信息，请参阅基于角色的访问控制。

1.3.6.11. 受管集群上的 Prometheus 数据丢失
复制链接

默认情况下，OpenShift 上的 Prometheus 使用临时存储。Prometheus 会在重启时丢失所有指标数据。

如果在由 Red Hat Advanced Cluster Management 管理的 OpenShift Container Platform 受管集群上启用或禁用了可观察性，observability 端点 Operator 会添加额外的 alertmanager 配置来自动重启本地 Prometheus，以此更新 cluster-monitoring-config ConfigMap。

1.3.6.12. Error ingesting out-of-order samples
复制链接

Observability receive pod 报告以下出错信息：

Error on ingesting out-of-order samples

错误消息表示，在指标收集间隔期间，由受管集群发送的时间序列数据比在之前的集合间隔发送的时间序列数据旧。当出现这个问题时，Thanos 接收器会丢弃数据，这可能会在 Grafana 仪表板中显示的数据中造成差距。如果经常看到这个错误，建议将指标收集间隔增加到一个更高的值。例如，您可以将间隔增加到 60 秒。

只有在时间序列间隔被设置为较低值（如 30 秒）时，才会注意到这个问题。请注意，当指标收集间隔被设置为默认值 300 秒时，不会看到这个问题。

1.3.6.13. 升级后 Grafana 部署失败
复制链接

如果您在 2.6 之前的系统中部署了 grafana-dev 实例，并将环境升级到 2.6，grafana-dev 无法正常工作。您必须运行以下命令来删除现有 grafana-dev 实例：

./setup-grafana-dev.sh --clean

使用以下命令重新创建实例：

./setup-grafana-dev.sh --deploy

1.3.6.14. klusterlet-addon-search pod 失败
复制链接

klusterlet-addon-search pod 失败，因为达到内存限制。您必须通过自定义受管集群中的 klusterlet-addon-search 部署来更新内存请求和限制。在 hub 集群中编辑名为 search-collector 的 ManagedclusterAddon 自定义资源。在 search-collector 中添加以下注解并更新内存 addon.open-cluster-management.io/search_memory_request=512Mi 和 addon.open-cluster-management.io/search_memory_limit=1024Mi。

例如，如果您有一个名为 foobar 的受管集群，请运行以下命令将内存请求更改为 512Mi，内存限值为 1024Mi ：

oc annotate managedclusteraddon search-collector -n foobar \
addon.open-cluster-management.io/search_memory_request=512Mi \
addon.open-cluster-management.io/search_memory_limit=1024Mi

1.3.6.15. 启用 disableHubSelfManagement 在 Grafana 仪表板中会导致空列表
复制链接

如果在 mulitclusterengine 自定义资源中将 disableHubSelfManagement 参数设置为 true 时，Grafana 仪表板会显示一个空标签列表。您必须将参数设置为 false 或删除参数来查看标签列表。如需了解更多详细信息，请参阅 disableHubSelfManagement。

1.3.6.15.1. 端点 URL 无法具有完全限定域名 (FQDN)
复制链接

当您将 FQDN 或协议用于 endpoint 参数时，您的可观察性 pod 不会被启用。此时会显示以下出错信息：

Endpoint url cannot have fully qualified paths

输入没有协议部分的 URL。您的 endpoint 值必须类似您的 secret 的以下 URL：

endpoint: example.com:443

1.3.6.15.2. Grafana downsampled 数据不匹配
复制链接

当您试图查询历史数据时，计算的步骤值和 downsampled 数据之间存在差异，则结果为空。例如，如果计算的步骤值为 5m，而 downsampled 数据处于一小时的时间间隔，则数据不会出现在 Grafana 中。

这是因为 URL 查询参数必须通过 Thanos Query 前端数据源传递。之后，URL 查询可以在缺少数据时对其他降级级别执行额外的查询。

您必须手动更新 Thanos Query 前端数据源配置。完成以下步骤：

进入 Query 前端数据源。
要更新您的查询参数，请点击 Misc 部分。
在 Custom query parameters 字段中，选择 max_source_resolution=auto。
要验证是否显示数据，请刷新 Grafana 页面。

您的查询数据会出现在 Grafana 仪表板中。

1.3.6.16. 指标收集器不会检测代理配置
复制链接

指标收集器不会检测到您使用 addonDeploymentConfig 配置的受管集群中的代理配置。作为临时解决方案，您可以通过删除受管集群 ManifestWork 来启用代理。删除 ManifestWork 会强制应用 addonDeploymentConfig 中的更改。

1.3.6.17. 使用自定义受管集群 Observatorium API 或 Alertmanager URL 时的限制
复制链接

自定义 Observatorium API 和 Alertmanager URL 仅支持带有 TLS 透传的中间组件。如果两个自定义 URL 都指向同一中间组件，则必须使用单独的子域，因为 OpenShift Container Platform 路由器不支持具有相同主机的两个单独的路由对象。

1.3.6.17.1. 搜索不显示受管集群的节点信息
复制链接

搜索 hub 集群中资源的 RBAC 映射。根据 RBAC 设置，用户可能无法看到来自受管集群的节点数据。搜索的结果可能与集群的 Nodes 页面中显示的结果不同。

1.3.7. 已知的监管问题
复制链接

查看监管的已知问题。以下列表包含本发行版本的已知问题，或从上一版本中继承的问题。

对于 Red Hat OpenShift Container Platform 集群，请参阅 OpenShift Container Platform 已知问题。

有关弃用和删除的更多信息，请参阅为 Red Hat Advanced Cluster Management 弃用和删除。

1.3.7.1. 当命名空间处于 Terminating 状态时，配置策略列出了 complaint
复制链接

当您有一个为 complianceType 参数配置的配置策略，并为 remediationAction 参数配置 enforce 时，当向 Kubernetes API 发出删除请求时，策略会列为合规。因此，在策略列为合规时，Kubernetes 对象可能会一直处于 Terminating 状态。

1.3.7.2. 使用策略部署的 Operator 不支持 ARM
复制链接

虽然支持安装到 ARM 环境中，但使用策略部署的 operator 可能不支持 ARM 环境。安装 Operator 的以下策略不支持 ARM 环境：

1.3.7.3. ConfigurationPolicy 自定义资源定义会一直处于终止状态
复制链接

当您通过在 KlusterletAddonConfig 或分离集群中禁用策略控制器或从受管集群中删除 config-policy-controller 附加组件时，ConfigurationPolicy 自定义资源定义可能会处于终止状态。如果 ConfigurationPolicy 自定义资源定义一直处于终止状态，则在稍后重新安装附加组件时可能不会添加新策略。您还可以收到以下错误：

template-error; Failed to create policy template: create not allowed while custom resource definition is terminating

使用以下命令检查自定义资源定义是否卡住：

oc get crd configurationpolicies.policy.open-cluster-management.io -o=jsonpath='{.metadata.deletionTimestamp}'

如果删除时间戳位于资源上，则自定义资源定义会卡住。要解决这个问题，从集群中保留的配置策略中删除所有终结器。在受管集群中使用以下命令，将 <cluster-namespace> 替换为受管集群命名空间：

oc get configurationpolicy -n <cluster-namespace> -o name | xargs oc patch -n <cluster-namespace> --type=merge -p '{"metadata":{"finalizers": []}}'

配置策略资源会自动从集群中移除，自定义资源定义会退出其终止状态。如果已经重新安装了附加组件，则会在没有删除时间戳的情况下自动重新创建自定义资源定义。

1.3.7.4. 强制时策略状态显示重复的更新
复制链接

如果策略被设置为 remediationAction: enforce 并重复更新，Red Hat Advanced Cluster Management 控制台会显示重复违反情况，并成功更新。重复更新生成多个策略事件，这可能会导致 governance-policy-framework-addon pod 耗尽内存和崩溃。请参阅以下可能的原因和错误解决方案：

另一个控制器或进程也使用不同的值更新对象。
要解决这个问题，请禁用策略并比较策略和受管集群上的 objectDefinition 之间的不同。如果值不同，则可能会更新另一个控制器或进程。检查对象的元数据，以帮助识别值的不同原因。
ConfigurationPolicy 中的 objectDefinition 不匹配，因为 Kubernetes 在应用策略时处理对象。
要解决这个问题，请禁用策略并比较策略和受管集群上的 objectDefinition 之间的不同。如果键不同或缺失，Kubernetes 可能会在将密钥应用到对象之前处理密钥，如删除包含默认值或空值的键。

1.3.7.5. 重复策略模板名称会创建 inconstistent 结果
复制链接

当您创建具有相同策略模板名称的策略时，您会收到不一致的结果，但您可能不知道原因。例如，使用名为 create-pod 的多个配置策略定义策略会导致结果不一致。最佳实践：对策略模板避免使用重复名称。

1.3.7.6. 数据库和策略合规历史记录 API 中断
复制链接

数据库和策略合规历史记录 API 中断内置弹性，但任何不能被受管集群记录的合规性事件都在内存中排队，直到成功记录为止。这意味着，如果中断，且受管集群重启时的 governance-policy-framework pod 会重启，则所有排队的合规性事件都会丢失。

如果在数据库中断期间创建或更新新策略，则无法记录针对此新策略发送的合规事件，因为策略到数据库 ID 的映射无法更新。当数据库恢复在线时，映射会自动更新，并记录来自这些策略的未来合规事件。

1.3.7.7. PostgreSQL 数据丢失
复制链接

如果 PostgreSQL 服务器有数据丢失，如在没有最新数据的备份的情况下恢复到备份，您必须在 Red Hat Advanced Cluster Management hub 集群上重启监管策略传播器，以便它可以将策略映射更新为数据库 ID。在重启监管策略传播器前，与数据库中存在的策略关联的新合规事件将不再记录。

要重启监管策略传播器，请在 Red Hat Advanced Cluster Management hub 集群中运行以下命令：

oc -n open-cluster-management rollout restart deployment/grc-policy-propagator

1.3.7.8. Kyverno 策略不再报告最新版本的状态
复制链接

Kyverno 策略由 Policy Generator 生成的策略报告 Red Hat Advanced Cluster Management 集群中的以下信息：

violation - couldn't find mapping resource with kind ClusterPolicyReport, please check if you have CRD deployed;
violation - couldn't find mapping resource with kind PolicyReport, please check if you have CRD deployed

原因是 PolicyReport API 版本在生成器中不正确，与部署的 Kyverno 不匹配。

1.3.8. 已知的与网络相关的问题
复制链接

查看 Submariner 的已知问题。以下列表包含本发行版本的已知问题，或从上一版本中继承的问题。

对于 Red Hat OpenShift Container Platform 集群，请参阅 OpenShift Container Platform 已知问题。

有关弃用和删除的更多信息，请参阅为 Red Hat Advanced Cluster Management 弃用和删除。

1.3.8.1. Submariner 已知问题
复制链接

请参阅以下在使用网络功能时可能出现的已知问题和限制。

1.3.8.1.1. 使用 OVN-Kubernetes 的 OpenShift Container Platform 上的应用程序不保留源 IP
复制链接

如果您在 4.18 和早于 4.19.5 的 4.19.5 版本之间使用 OpenShift Container Platform 版本，则当数据包到达目标 pod 时，不会保留源 IP。因此，依赖源 IP （如 NetworkPolicy ）的应用程序可能无法正常工作。

1.3.8.1.2. 没有 ClusterManagementAddon submariner 附加组件失败
复制链接

对于 2.8 及更早版本，当安装 Red Hat Advanced Cluster Management 时，您也可以使用 Operator Lifecycle Manager 部署 submariner-addon 组件。如果您没有创建 MultiClusterHub 自定义资源，submariner-addon pod 会发送错误并阻止 Operator 安装。

发生以下通知的原因是 ClusterManagementAddon 自定义资源定义缺失：

graceful termination failed, controllers failed with error: the server could not find the requested resource (post clustermanagementaddons.addon.open-cluster-management.io)

ClusterManagementAddon 资源由 cluster-manager 部署创建，但在集群中安装 MultiClusterEngine 组件时，此部署将可用。

如果在创建 MultiClusterHub 自定义资源时没有集群中可用的 MultiClusterEngine 资源，MultiClusterHub operator 会部署 MultiClusterEngine 实例，以及所需的 Operator，用于解析上一个错误。

1.3.8.1.3. 导入受管集群时，Submariner 附加组件资源没有正确清理
复制链接

如果在 MultiClusterHub (MCH) operator 中将 submariner-addon 组件设置为 false，则不会为受管集群资源正确清理 submariner-addon 终结器。因为没有被正确清理终结器，这会阻止 submariner-addon 组件在 hub 集群中被禁用。

1.3.8.1.4. Submariner 安装计划限制
复制链接

Submariner 安装计划不遵循整个安装计划设置。因此，Operator 管理屏幕无法控制 Submariner 安装计划。默认情况下，Submariner 安装计划会被自动应用，Submariner addon 始终更新至与已安装的 Red Hat Advanced Cluster Management 版本对应的最新可用版本。要更改此行为，您必须使用自定义 Submariner 订阅。

1.3.8.1.5. 有限的无头服务支持
复制链接

在使用 Globalnet 时，在没有选择器的情况下的无头服务不支持服务发现。

1.3.8.1.6. 不支持在启用 NAT 时使用 VXLAN 的部署
复制链接

只有非 NAT 部署支持使用 VXLAN 电缆驱动程序的 Submariner 部署。

1.3.8.1.7. 自签名证书可能会阻止到代理的连接
复制链接

代理上的自签名证书可能会阻止加入集群连接到代理。连接失败并显示证书验证错误。您可以通过在相关 SubmarinerConfig 对象中将 InsecureBrokerConnection 设置为 true 来禁用代理证书验证。请参见以下示例：

apiVersion: submarineraddon.open-cluster-management.io/v1alpha1
kind: SubmarinerConfig
metadata:
   name: submariner
   namespace: <managed-cluster-namespace>
spec:
   insecureBrokerConnection: true

1.3.8.1.8. Submariner 只支持 OpenShift SDN 或 OVN Kubernetes
复制链接

Submariner 只支持使用 OpenShift SDN 或 OVN-Kubernetes Container Network Interface (CNI) 网络供应商的 Red Hat OpenShift Container Platform 集群。

1.3.8.1.9. Microsoft Azure 集群的命令限制
复制链接

subctl diagnose firewall inter-cluster 命令无法在 Microsoft Azure 集群中工作。

1.3.8.1.10. 自动升级无法使用自定义 CatalogSource 或 Subscription
复制链接

当 Red Hat Advanced Cluster Management for Kubernetes 升级时，Submariner 会被自动升级。如果您使用自定义 CatalogSource 或 Subscription，则自动升级可能会失败。

为确保在受管集群上安装 Submariner 时自动升级可以正常工作，您必须在每个受管集群的 SubmarinerConfig 自定义资源中将 spec.subscriptionConfig.channel 字段设置为 stable-0.15。

1.3.8.1.11. Submariner 与启用了 IPsec 的 OVN-Kubernetes 部署冲突
复制链接

由支持 IPsec 的 OVN-Kubernetes 部署创建的 IPsec 隧道可能与 Submariner 创建的 IPsec 隧道冲突。不要在 Submariner 中的 IPsec 模式下使用 OVN-Kubernetes。

1.3.8.1.12. 在从 ManageClusterSet中删除 ManagedCluster 前卸载 Submariner
复制链接

如果您从 ClusterSet 中删除集群，或将集群移到不同的 ClusterSet 中，Submariner 安装将不再有效。

在从 ManageClusterSet 移动或删除 ManagedCluster 前，您必须卸载 Submariner。如果没有卸载 Submariner，则无法再卸载或重新安装 Submariner，Submariner 会停止在 ManagedCluster 上工作。

1.3.9. 多集群全局 hub Operator 已知问题
复制链接

查看 multicluster global hub Operator 的已知问题。以下列表包含本发行版本的已知问题，或从上一版本中继承的问题。对于 OpenShift Container Platform 集群，请参阅 OpenShift Container Platform 已知问题。

1.3.9.1. 分离的受管 hub 集群会删除并重新创建命名空间和资源
复制链接

如果您以托管模式导入受管 hub 集群并分离此受管 hub 集群，则会删除并重新创建 open-cluster-management-agent-addon 命名空间。分离的受管 hub 集群也会删除并重新创建此命名空间中的所有附加组件资源。

当前没有解决此问题的方法。

1.3.9.2. Kafka operator 保留重启
复制链接

在联邦信息处理标准(FIPS)环境中，Kafka operator 会因为内存不足(OOM)状态而保持重启。要解决这个问题，请将资源限值设置为至少 512M。有关如何设置此限制的详细步骤，请参阅 amq stream doc。

1.3.9.3. 备份和恢复已知问题
复制链接

如果您的原始多集群全局 hub 集群崩溃，则多集群全局 hub 会丢失其生成的事件和 cron 作业。即使恢复新的多集群全局 hub 集群，事件和 cron 作业也不会恢复。要解决这个问题，您可以手动运行 cron 作业，请参阅手动运行 summarization 进程。

1.3.9.4. 受管集群显示但不计算
复制链接

没有成功创建的受管集群，即受管集群中不存在 clusterclaim id.k8s.io，策略合规仪表板中没有计数，而是显示在策略控制台中。

1.3.9.5. multicluster global hub 安装在 OpenShift Container Platform 4.13 超链接上可能会重定向主页
复制链接

如果在 OpenShift Container Platform 4.13 上安装 multicluster global hub Operator，链接到受管集群列表的所有超链接以及仪表板中的详情页面都会重定向到 Red Hat Advanced Cluster Management 主页。

您需要手动转至目标页面。

1.3.9.6. 标准组过滤器无法传递给新页面
复制链接

在 Global Hub Policy Group Compliancy Overview hub 仪表板中，您可以通过单击 标准组的 View Offending Policies 来检查一个数据点，但在点击此链接后，标准组过滤器无法传递给新页面。

这也是 Cluster Group Compliancy 概述 的问题。

1.4. 为 Red Hat Advanced Cluster Management 弃用和删除
复制链接

了解产品将在什么时候被弃用，或从 Red Hat Advanced Cluster Management for Kubernetes 中删除。考虑推荐操作中的备选操作和详细信息，它们显示在当前版本的表中和之前两个版本。

弃用： Red Hat Advanced Cluster Management 2.8 及更早的版本不再被支持。文档可能仍然可用，但没有任何勘误或其他更新。

最佳实践： 升级到最新版本。

1.4.1. API 弃用和删除
复制链接

Red Hat Advanced Cluster Management 的 API 会遵循 Kubernetes 弃用指南。有关相关策略的详情，请参阅 Kubernetes 弃用策略。Red Hat Advanced Cluster Management API 只在以下时间线外才会被弃用或删除：

所有 V1 API 已正式发布（GA），提供 12 个月或跨三个发行版本（以更长的时间为准）的支持。V1 API 没有被删除，但可能会在这个时间限制外被弃用。
所有 beta API 通常在九个月或跨三个发行版本（以更长的时间为准）内可用。Beta API 不会在这个时间限制外被删除。
所有 alpha API 都不是必需的，但如果对用户有好处，则可能会被列为已弃用或删除。

1.4.2. Red Hat Advanced Cluster Management 弃用
复制链接

弃用（deprecated）组件、功能或服务会被支持，但不推荐使用，并可能在以后的版本中被删除。考虑使用推荐操作中的相应的替代操作，详情在下表中提供：

Expand

产品或类别	受影响的项	Version	推荐的操作	详情和链接
概述页面	Red Hat Advanced Cluster Management for Kubernetes 搜索	2.12	启用 Fleet 视图开关来查看新的默认 Overview 页面。	Red Hat Advanced Cluster Management Overview 页的以前的布局已弃用。
策略合规历史记录 API	监管	2.12	使用现有策略指标查看合规性状态更改。您还可以查看 `config-policy-controller` 和 `cert-policy-controller` pod 日志，以获取每个受管集群的详细合规性历史记录。	如需更多信息，请参阅策略控制器高级配置。
安装程序	`operator.open-cluster-management.io_multiclusterhubs_crd.yaml` 中的 `ingress.sslCiphers` 字段	2.9	None	请参阅高级配置来配置安装。如果您升级了 Red Hat Advanced Cluster Management for Kubernetes 版本，且最初有一个带有 `spec.ingress.sslCiphers` 字段的 `MultiClusterHub` 自定义资源，则该字段仍然被识别，但已弃用，且不会起作用。
应用程序和管理	`PlacementRule`	2.8	在使用 `PlacementRule` 的位置使用 `Placement`。	虽然 `PlacementRule` 仍然可用，但它不被支持，控制台默认会显示 `Placement`。

1.4.3. 删除
复制链接

一个删除（removed） 的项通常是在之前的版本中被弃用的功能，在该产品中不再可用。您必须将 alternatives 用于删除的功能。考虑使用推荐操作中的相应的替代操作，详情在下表中提供：

Expand

产品或类别	受影响的项	Version	推荐的操作	详情和链接
监管	IAM 策略控制器	2.11	None

1.6. FIPS 就绪性
复制链接

Red Hat Advanced Cluster Management for Kubernetes 是为 FIPS 设计的。当以 FIPS 模式在 Red Hat OpenShift Container Platform 上运行时，OpenShift Container Platform 将使用提交至 NIST 的 Red Hat Enterprise Linux 加密库，以仅在 OpenShift Container Platform 支持的架构上进行 FIPS 验证。有关 NIST 验证程序的更多信息，请参阅加密模块验证程序。有关为验证提交的 RHEL 加密库的单独版本的最新 NIST 状态，请参阅 Compliance Activities 和 Government Standards。

如果您计划管理启用了 FIPS 的集群，您必须在配置为以 FIPS 模式运行的 OpenShift Container Platform 集群上安装 Red Hat Advanced Cluster Management。hub 集群必须处于 FIPS 模式，因为在受管集群中使用在 hub 集群上创建的加密。

要在受管集群中启用 FIPS 模式，在置备 OpenShift Container Platform 受管集群时设置 fips: true。置备集群后您无法启用 FIPS。如需更多信息，请参阅 OpenShift Container Platform 文档中的集群需要额外的安全性？

1.6.1. 限制：
复制链接

阅读 Red Hat Advanced Cluster Management 和 FIPS 中的以下限制。

在配置提供的存储时，必须对搜索和可观察组件使用的持久性卷声明(PVC)和 S3 存储进行加密。Red Hat Advanced Cluster Management 不提供存储加密，请参阅 OpenShift Container Platform 文档配置持久性存储。

当使用 Red Hat Advanced Cluster Management 控制台置备受管集群时，在受管集群创建的 Cluster details 部分中选中以下复选框以启用 FIPS 标准：

FIPS with information text: Use the Federal Information Processing Standards (FIPS) modules provided with Red Hat Enterprise Linux CoreOS instead of the default Kubernetes cryptography suite file before you deploy the new managed cluster.

1.7. Observability 支持
复制链接

Red Hat Advanced Cluster Management 使用 Red Hat OpenShift Data Foundation （以前称为 Red Hat OpenShift Container Platform）进行测试并被完全支持。
Red Hat Advanced Cluster Management 支持在用户提供的兼容 S3 API 的第三方对象存储中多集群可观察 Operator 的功能。Observability 服务使用 Thanos 支持的、稳定的对象存储。
Red Hat Advanced Cluster Management 支持工作包括识别根本原因的合理努力。如果您创建一个支持问题单，则根本原因是您提供的 S3 兼容对象存储，则必须使用客户支持频道打开问题。

法律通告
复制链接

The text of and illustrations in this document are licensed by Red Hat under a Creative Commons Attribution–Share Alike 3.0 Unported license ("CC-BY-SA"). An explanation of CC-BY-SA is available at http://creativecommons.org/licenses/by-sa/3.0/. In accordance with CC-BY-SA, if you distribute this document or an adaptation of it, you must provide the URL for the original version.

Red Hat, as the licensor of this document, waives the right to enforce, and agrees not to assert, Section 4d of CC-BY-SA to the fullest extent permitted by applicable law.

Red Hat, Red Hat Enterprise Linux, the Shadowman logo, the Red Hat logo, JBoss, OpenShift, Fedora, the Infinity logo, and RHCE are trademarks of Red Hat, Inc., registered in the United States and other countries.

Linux® is the registered trademark of Linus Torvalds in the United States and other countries.

Java® is a registered trademark of Oracle and/or its affiliates.

XFS® is a trademark of Silicon Graphics International Corp. or its subsidiaries in the United States and/or other countries.

MySQL® is a registered trademark of MySQL AB in the United States, the European Union and other countries.

Node.js® is an official trademark of Joyent. Red Hat is not formally related to or endorsed by the official Joyent Node.js open source or commercial project.

The OpenStack® Word Mark and OpenStack logo are either registered trademarks/service marks or trademarks/service marks of the OpenStack Foundation, in the United States and other countries and are used with the OpenStack Foundation's permission. We are not affiliated with, endorsed or sponsored by the OpenStack Foundation, or the OpenStack community.

All other trademarks are the property of their respective owners.

发行注记

了解新功能，访问 Red Hat Advanced Cluster Management 支持列表，并查看勘误更新。查找已知问题和限制、弃用和删除以及 GDPR 和 FIPS 就绪的信息。

第 1 章 Red Hat Advanced Cluster Management 发行注记复制链接链接已复制到粘贴板!

1.1. Red Hat Advanced Cluster Management 的新内容复制链接链接已复制到粘贴板!

1.1.1. 组件的新功能和增强复制链接链接已复制到粘贴板!

1.1.2. 安装复制链接链接已复制到粘贴板!

1.1.3. 控制台（Console）复制链接链接已复制到粘贴板!

1.1.4. Clusters复制链接链接已复制到粘贴板!

1.1.5. 多集群全局 hub复制链接链接已复制到粘贴板!

1.1.6. 应用程序复制链接链接已复制到粘贴板!

1.1.7. Observability（可观察性）复制链接链接已复制到粘贴板!

1.1.8. 监管复制链接链接已复制到粘贴板!

1.1.9. 备份和恢复复制链接链接已复制到粘贴板!

1.1.10. 使用 Red Hat Advanced Cluster Management 集成的 multicluster engine operator复制链接链接已复制到粘贴板!

1.1.11. 了解有关此发行版本的更多信息复制链接链接已复制到粘贴板!

1.2. Red Hat Advanced Cluster Management 的勘误更新复制链接链接已复制到粘贴板!

1.2.1. Errata 2.12.5复制链接链接已复制到粘贴板!

1.2.2. Errata 2.12.4复制链接链接已复制到粘贴板!

1.2.3. Errata 2.12.3复制链接链接已复制到粘贴板!

1.2.4. Errata 2.12.2复制链接链接已复制到粘贴板!

1.2.5. Errata 2.12.1复制链接链接已复制到粘贴板!

1.3. Red Hat Advanced Cluster Management 的已知问题和限制复制链接链接已复制到粘贴板!

1.3.1. 已知的与安装相关的问题复制链接链接已复制到粘贴板!

1.3.1.1. 使用 OpenShift Container Platform 4.18 升级现有 Red Hat Advanced Cluster Management 集群会导致安装 CRD 错误复制链接链接已复制到粘贴板!

1.3.1.2. 使用升级卸载和重新安装早期版本可能会失败复制链接链接已复制到粘贴板!

1.3.1.3. 带有 ARM 聚合流的基础架构 operator 错误复制链接链接已复制到粘贴板!

1.3.2. 已知的业务连续问题复制链接链接已复制到粘贴板!

1.3.2.1. 备份和恢复已知问题复制链接链接已复制到粘贴板!

1.3.2.1.1. open-cluster-management-backup 命名空间处于 Terminating 状态复制链接链接已复制到粘贴板!

1.3.2.1.2. 裸机 hub 资源不再由受管集群备份备份复制链接链接已复制到粘贴板!

1.3.2.1.3. Velero 恢复限制复制链接链接已复制到粘贴板!

1.3.2.1.4. 被动配置不显示受管集群复制链接链接已复制到粘贴板!

1.3.2.1.5. 未恢复受管集群资源复制链接链接已复制到粘贴板!

1.3.2.1.6. 恢复的 Hive 受管集群可能无法与新的 hub 集群连接复制链接链接已复制到粘贴板!

1.3.2.1.7. 导入的受管集群显示 Pending Import 状态复制链接链接已复制到粘贴板!

1.3.2.1.8. 恢复 hub 集群后，appliedmanifestwork 不会被从受管集群中删除复制链接链接已复制到粘贴板!

1.3.2.1.9. 应用的manifestwork 不会被删除，规格中缺少 agentID复制链接链接已复制到粘贴板!

1.3.2.1.10. managed-serviceaccount add-on 状态显示 Unknown复制链接链接已复制到粘贴板!

1.3.2.2. VolSync 已知问题复制链接链接已复制到粘贴板!

1.3.2.2.1. 删除附加组件时，手动删除受管集群上所需的 VolSync CSV复制链接链接已复制到粘贴板!

1.3.2.2.2. 使用自定义 CA 证书恢复到其恢复的 hub 集群连接可能会失败复制链接链接已复制到粘贴板!

1.3.3. 已知的控制台问题复制链接链接已复制到粘贴板!

1.3.3.1. 无法在控制台中升级 OpenShift Dedicated复制链接链接已复制到粘贴板!

1.3.3.2. 搜索 PostgreSQL pod 处于 CrashLoopBackoff 状态复制链接链接已复制到粘贴板!

1.3.3.3. 无法编辑集群集的命名空间绑定复制链接链接已复制到粘贴板!

1.3.3.4. 在置备托管的 control plane 集群后，水平滚动无法正常工作复制链接链接已复制到粘贴板!

1.3.3.5. EditApplicationSet 扩展功能重复复制链接链接已复制到粘贴板!

1.3.3.6. 无法从 Red Hat Advanced Cluster Management 注销复制链接链接已复制到粘贴板!

1.3.3.7. 在 OpenShift Cloud Manager 控制台中输入 cluster-ID 的问题复制链接链接已复制到粘贴板!

1.3.4. 已知的与集群管理相关的问题和限制复制链接链接已复制到粘贴板!

1.3.4.1. hub 集群通信限制复制链接链接已复制到粘贴板!

1.3.4.2. local-cluster 可能无法自动重新创建复制链接链接已复制到粘贴板!

1.3.4.3. 使用不同名称重新导入后 local-cluster 状态为离线复制链接链接已复制到粘贴板!

1.3.4.4. hub 集群和受管集群的时钟未同步复制链接链接已复制到粘贴板!

1.3.5. 已知的与应用程序相关的问题和限制复制链接链接已复制到粘贴板!

1.3.5.1. 应用程序拓扑显示无效的表达式复制链接链接已复制到粘贴板!

1.3.5.2. 使用 PlacementRule 编辑订阅应用程序不会在编辑器中显示订阅 YAML复制链接链接已复制到粘贴板!

1.3.5.3. 带有 secret 依赖项的 Helm Chart 无法由 Red Hat Advanced Cluster Management 订阅部署复制链接链接已复制到粘贴板!

1.3.5.4. 拓扑无法正确显示 Argo CD pull 模型 ApplicationSet 应用程序复制链接链接已复制到粘贴板!

1.3.5.5. 本地集群被排除为拉取模型的受管集群复制链接链接已复制到粘贴板!

1.3.5.6. Argo CD 控制器和传播控制器可能会同时协调复制链接链接已复制到粘贴板!

1.3.5.7. 资源无法部署复制链接链接已复制到粘贴板!

1.3.5.8. 资源分配可能需要几分钟时间复制链接链接已复制到粘贴板!

1.3.5.9. 应用程序 ObjectBucket 频道类型无法使用 allow 和 deny 列表复制链接链接已复制到粘贴板!

1.3.5.9.1. Argo Application 无法部署到 3.x OpenShift Container Platform 受管集群复制链接链接已复制到粘贴板!

1.3.5.10. 对 multicluster_operators_subscription 镜像的更改不会自动生效复制链接链接已复制到粘贴板!

1.3.5.11. 除非根据订阅管理员部署策略资源复制链接链接已复制到粘贴板!

1.3.5.12. 应用程序 Ansible hook 独立模式复制链接链接已复制到粘贴板!

1.3.5.13. 在更新的放置规则后没有部署应用程序复制链接链接已复制到粘贴板!

1.3.5.14. Subscription operator 不会创建一个 SCC复制链接链接已复制到粘贴板!

1.3.5.15. 应用程序频道需要唯一的命名空间复制链接链接已复制到粘贴板!

1.3.5.16. Ansible Automation Platform 作业失败复制链接链接已复制到粘贴板!

1.3.5.17. Ansible Automation Platform operator 在代理外访问 Ansible Automation Platform复制链接链接已复制到粘贴板!

1.3.5.18. 应用程序名称要求复制链接链接已复制到粘贴板!

1.3.5.19. 应用程序控制台表限制复制链接链接已复制到粘贴板!

1.3.5.20. 没有应用程序控制台拓扑过滤复制链接链接已复制到粘贴板!

1.3.5.21. 允许和拒绝列表在对象存储应用程序中无法正常工作复制链接链接已复制到粘贴板!

1.3.6. 已知的可观察性问题复制链接链接已复制到粘贴板!

1.3.6.1. 缺少 Grafana 仪表板复制链接链接已复制到粘贴板!

1.3.6.2. 保留更改会导致数据丢失复制链接链接已复制到粘贴板!

第 1 章 Red Hat Advanced Cluster Management 发行注记
复制链接

1.1. Red Hat Advanced Cluster Management 的新内容
复制链接

1.1.1. 组件的新功能和增强
复制链接

1.1.2. 安装
复制链接

1.1.3. 控制台（Console）
复制链接

1.1.4. Clusters
复制链接

1.1.5. 多集群全局 hub
复制链接

1.1.6. 应用程序
复制链接

1.1.7. Observability（可观察性）
复制链接

1.1.8. 监管
复制链接

1.1.9. 备份和恢复
复制链接

1.1.10. 使用 Red Hat Advanced Cluster Management 集成的 multicluster engine operator
复制链接

1.1.11. 了解有关此发行版本的更多信息
复制链接

1.2. Red Hat Advanced Cluster Management 的勘误更新
复制链接

1.2.1. Errata 2.12.5
复制链接

1.2.2. Errata 2.12.4
复制链接

1.2.3. Errata 2.12.3
复制链接

1.2.4. Errata 2.12.2
复制链接

1.2.5. Errata 2.12.1
复制链接

1.3. Red Hat Advanced Cluster Management 的已知问题和限制
复制链接

1.3.1. 已知的与安装相关的问题
复制链接

1.3.1.1. 使用 OpenShift Container Platform 4.18 升级现有 Red Hat Advanced Cluster Management 集群会导致安装 CRD 错误
复制链接

1.3.1.2. 使用升级卸载和重新安装早期版本可能会失败
复制链接

1.3.1.3. 带有 ARM 聚合流的基础架构 operator 错误
复制链接

1.3.2. 已知的业务连续问题
复制链接

1.3.2.1. 备份和恢复已知问题
复制链接

1.3.2.1.1. open-cluster-management-backup 命名空间处于 Terminating 状态
复制链接

1.3.2.1.2. 裸机 hub 资源不再由受管集群备份备份
复制链接

1.3.2.1.3. Velero 恢复限制
复制链接

1.3.2.1.4. 被动配置不显示受管集群
复制链接

1.3.2.1.5. 未恢复受管集群资源
复制链接

1.3.2.1.6. 恢复的 Hive 受管集群可能无法与新的 hub 集群连接
复制链接

1.3.2.1.7. 导入的受管集群显示 Pending Import 状态
复制链接

1.3.2.1.8. 恢复 hub 集群后，appliedmanifestwork 不会被从受管集群中删除
复制链接

1.3.2.1.9. 应用的manifestwork 不会被删除，规格中缺少 agentID
复制链接

1.3.2.1.10. managed-serviceaccount add-on 状态显示 Unknown
复制链接

1.3.2.2. VolSync 已知问题
复制链接

1.3.2.2.1. 删除附加组件时，手动删除受管集群上所需的 VolSync CSV
复制链接

1.3.2.2.2. 使用自定义 CA 证书恢复到其恢复的 hub 集群连接可能会失败
复制链接

1.3.3. 已知的控制台问题
复制链接

1.3.3.1. 无法在控制台中升级 OpenShift Dedicated
复制链接

1.3.3.2. 搜索 PostgreSQL pod 处于 CrashLoopBackoff 状态
复制链接

1.3.3.3. 无法编辑集群集的命名空间绑定
复制链接

1.3.3.4. 在置备托管的 control plane 集群后，水平滚动无法正常工作
复制链接

1.3.3.5. EditApplicationSet 扩展功能重复
复制链接

1.3.3.6. 无法从 Red Hat Advanced Cluster Management 注销
复制链接

1.3.3.7. 在 OpenShift Cloud Manager 控制台中输入 cluster-ID 的问题
复制链接

1.3.4. 已知的与集群管理相关的问题和限制
复制链接

1.3.4.1. hub 集群通信限制
复制链接

1.3.4.2. local-cluster 可能无法自动重新创建
复制链接

1.3.4.3. 使用不同名称重新导入后 local-cluster 状态为离线
复制链接

1.3.4.4. hub 集群和受管集群的时钟未同步
复制链接

1.3.5. 已知的与应用程序相关的问题和限制
复制链接

1.3.5.1. 应用程序拓扑显示无效的表达式
复制链接

1.3.5.2. 使用 PlacementRule 编辑订阅应用程序不会在编辑器中显示订阅 YAML
复制链接

1.3.5.3. 带有 secret 依赖项的 Helm Chart 无法由 Red Hat Advanced Cluster Management 订阅部署
复制链接

1.3.5.4. 拓扑无法正确显示 Argo CD pull 模型 ApplicationSet 应用程序
复制链接

1.3.5.5. 本地集群被排除为拉取模型的受管集群
复制链接

1.3.5.6. Argo CD 控制器和传播控制器可能会同时协调
复制链接

1.3.5.7. 资源无法部署
复制链接

1.3.5.8. 资源分配可能需要几分钟时间
复制链接

1.3.5.9. 应用程序 ObjectBucket 频道类型无法使用 allow 和 deny 列表
复制链接

1.3.5.9.1. Argo Application 无法部署到 3.x OpenShift Container Platform 受管集群
复制链接

1.3.5.10. 对 multicluster_operators_subscription 镜像的更改不会自动生效
复制链接

1.3.5.11. 除非根据订阅管理员部署策略资源
复制链接

1.3.5.12. 应用程序 Ansible hook 独立模式
复制链接

1.3.5.13. 在更新的放置规则后没有部署应用程序
复制链接

1.3.5.14. Subscription operator 不会创建一个 SCC
复制链接

1.3.5.15. 应用程序频道需要唯一的命名空间
复制链接

1.3.5.16. Ansible Automation Platform 作业失败
复制链接

1.3.5.17. Ansible Automation Platform operator 在代理外访问 Ansible Automation Platform
复制链接

1.3.5.18. 应用程序名称要求
复制链接

1.3.5.19. 应用程序控制台表限制
复制链接

1.3.5.20. 没有应用程序控制台拓扑过滤
复制链接

1.3.5.21. 允许和拒绝列表在对象存储应用程序中无法正常工作
复制链接

1.3.6. 已知的可观察性问题
复制链接

1.3.6.1. 缺少 Grafana 仪表板
复制链接

1.3.6.2. 保留更改会导致数据丢失
复制链接

1.3.6.3. 恢复 hub 集群中的 observatorium API 网关 pod 可能具有过时的租户数据
复制链接

1.3.6.4. 在 openshift-monitoring 命名空间中添加 PrometheusRules 和 ServiceMonitor 的权限
复制链接