7.7. 推荐的安装后集群配置
当集群安装完成后,ZTP 管道会应用运行 DU 工作负载所需的以下自定义资源 (CR)。
在 GitOps ZTP v4.10 及更早版本中,您可以使用 MachineConfig
CR 配置 UEFI 安全引导。GitOps ZTP v4.11 及更新的版本中不再需要。在 v4.11 中,您可以通过更新用于安装集群的 SiteConfig
CR 中的 spec.clusters.nodes.bootMode
字段来为单节点 OpenShift 集群配置 UEFI 安全引导。如需更多信息,请参阅使用 SiteConfig 和 GitOps ZTP 部署受管集群。
7.7.1. Operator 复制链接链接已复制到粘贴板!
运行 DU 工作负载的单节点 OpenShift 集群需要安装以下 Operator:
- Local Storage Operator
- Logging Operator
- PTP Operator
- Cluster Network Operator
您还需要配置自定义 CatalogSource
CR,禁用默认的 OperatorHub
配置,并配置可从您安装的集群访问的 ImageContentSourcePolicy
镜像 registry。
推荐的 Storage Operator 命名空间和 Operator 组配置 (StorageNS.yaml
,StorageOperGroup.yaml
)
推荐的 Cluster Logging Operator 命名空间和 Operator 组配置 (ClusterLogNS.yaml
,ClusterLogOperGroup.yaml
)
推荐的 PTP Operator 命名空间和 Operator 组配置 (PtpSubscriptionNS.yaml
,PtpSubscriptionOperGroup.yaml
)
推荐的 SR-IOV Operator 命名空间和 Operator 组配置 (SriovSubscriptionNS.yaml
,SriovSubscriptionOperGroup.yaml
)
推荐的 CatalogSource
配置 (DefaultCatsrc.yaml
)
推荐的 ImageContentSourcePolicy
配置 (DisconnectedICSP.yaml
)
推荐的 OperatorHub
配置 (OperatorHub.yaml
)
7.7.2. Operator 订阅 复制链接链接已复制到粘贴板!
运行 DU 工作负载的单节点 OpenShift 集群需要以下 Subscription
CR。订阅提供下载以下 Operator 的位置:
- Local Storage Operator
- Logging Operator
- PTP Operator
- Cluster Network Operator
- SRIOV-FEC Operator
对于每个 Operator 订阅,指定要从中获取 Operator 的频道。推荐的频道是 stable
。
您可以指定 Manual
或 Automatic
更新。在 Automatic
模式中,Operator 会在 registry 中可用时自动更新到频道中最新版本。在 Manual
模式中,只有在被明确批准时才会安装新的 Operator 版本。
对订阅使用 Manual
模式。这可让您控制 Operator 更新在调度的维护窗口中适合的时间。
推荐的 Local Storage Operator 订阅 (StorageSubscription.yaml
)
推荐的 SR-IOV Operator 订阅 (SriovSubscription.yaml
)
推荐的 PTP Operator 订阅 (PtpSubscription.yaml
)
推荐的 Cluster Logging Operator 订阅 (ClusterLogSubscription.yaml
)
7.7.3. 集群日志记录和日志转发 复制链接链接已复制到粘贴板!
运行 DU 工作负载的单节点 OpenShift 集群需要日志记录和日志转发以进行调试。需要以下 ClusterLogging
和 ClusterLogForwarder
自定义资源 (CR)。
推荐的集群日志记录配置 (ClusterLogging.yaml
)
推荐的日志转发配置 (ClusterLogForwarder.yaml
)
将 spec.outputs.url
字段设置为日志转发到的 Kafka 服务器的 URL。
7.7.4. 性能配置集 复制链接链接已复制到粘贴板!
运行 DU 工作负载的单节点 OpenShift 集群需要 Node Tuning Operator 性能配置集才能使用实时主机功能和服务。
在早期版本的 OpenShift Container Platform 中,Performance Addon Operator 用来实现自动性能优化,以便为 OpenShift 应用程序实现低延迟性能。在 OpenShift Container Platform 4.11 及更新的版本中,这个功能是 Node Tuning Operator 的一部分。
以下示例 PerformanceProfile
CR 演示了所需的单节点 OpenShift 集群配置。
推荐的性能配置集配置 (PerformanceProfile.yaml
)
PerformanceProfile CR 字段 | 描述 |
---|---|
|
确保
|
|
|
| 设置隔离的 CPU。确保所有 Hyper-Threading 对都匹配。 重要 保留和隔离的 CPU 池不得重叠,并且必须一起跨越所有可用的内核。未考虑导致系统中未定义的 CPU 内核。 |
| 设置保留的 CPU。启用工作负载分区时,系统进程、内核线程和系统容器线程仅限于这些 CPU。所有不是隔离的 CPU 都应保留。 |
|
|
|
将 |
|
使用 |
7.7.5. 配置集群时间同步 复制链接链接已复制到粘贴板!
为 control plane 或 worker 节点运行一次性系统时间同步作业。
推荐的 control plane 节点一次同步 (99-sync-time-once-master.yaml
)
推荐的 worker 节点一次同步时间 (99-sync-time-once-worker.yaml
)
7.7.6. PTP 复制链接链接已复制到粘贴板!
单节点 OpenShift 集群使用 Precision Time Protocol (PTP) 进行网络时间同步。以下示例 PtpConfig
CR 演示了普通时钟、边界时钟和 grandmaster 时钟所需的 PTP 配置。您应用的确切配置将取决于节点硬件和特定用例。
推荐的 PTP 普通时钟配置 (PtpConfigSlave.yaml
)
推荐的边界时钟配置 (PtpConfigBoundary.yaml
)
推荐的 PTP Westport Channel e810 grandmaster 时钟配置 (PtpConfigGmWpc.yaml
)
以下可选 PtpOperatorConfig
CR 为节点配置 PTP 事件报告。
推荐的 PTP 事件配置 (PtpOperatorConfigForEvent.yaml
)
7.7.7. 扩展的 Tuned 配置集 复制链接链接已复制到粘贴板!
运行 DU 工作负载的单节点 OpenShift 集群需要额外的高性能工作负载所需的性能调优配置。以下 Tuned
CR 示例扩展了 Tuned
配置集:
推荐的扩展 Tuned
配置集配置 (Tuned PerformancePatch.yaml
)
TuneD CR 字段 | 描述 |
---|---|
|
|
7.7.8. SR-IOV 复制链接链接已复制到粘贴板!
单根 I/O 虚拟化(SR-IOV)通常用于启用前端和中间网络。以下 YAML 示例为单节点 OpenShift 集群配置 SR-IOV。
SriovNetwork
CR 的配置会根据您的特定网络和基础架构要求而有所不同。
推荐的 SriovOperatorConfig
CR 配置 (SriovOperatorConfig.yaml
)
SriovOperatorConfig CR 字段 | 描述 |
---|---|
|
禁用 例如: |
|
禁用 |
推荐的 SriovNetwork
配置 (SriovNetwork.yaml
)
SriovNetwork CR 字段 | 描述 |
---|---|
|
为 midhaul 网络配置 VLAN 的 |
推荐的 SriovNetworkNodePolicy
CR 配置 (SriovNetworkNodePolicy.yaml
)
SriovNetworkNodePolicy CR 字段 | 描述 |
---|---|
|
将 |
| 指定连接到前端网络的接口。 |
| 指定前端网络的 VF 数量。 |
| 物理功能的确切名称必须与硬件匹配。 |
推荐的 SR-IOV 内核配置 (07-sriov-related-kernel-args-master.yaml
)
7.7.9. Console Operator 复制链接链接已复制到粘贴板!
使用集群功能来防止安装 Console Operator。当节点被集中管理时,不需要它。删除 Operator 为应用程序工作负载提供额外的空间和容量。
要在安装过程中禁用 Console Operator,请在 SiteConfig
自定义资源(CR)的 spec.clusters.0.installConfigOverrides
字段中设置以下内容:
installConfigOverrides: "{\"capabilities\":{\"baselineCapabilitySet\": \"None\" }}"
installConfigOverrides: "{\"capabilities\":{\"baselineCapabilitySet\": \"None\" }}"
7.7.10. Alertmanager 复制链接链接已复制到粘贴板!
运行 DU 工作负载的单节点 OpenShift 集群需要减少 OpenShift Container Platform 监控组件所消耗的 CPU 资源。以下 ConfigMap
自定义资源(CR)禁用 Alertmanager。
推荐的集群监控配置 (ReduceMonitoringFootprint.yaml
)
7.7.11. Operator Lifecycle Manager 复制链接链接已复制到粘贴板!
运行分布式单元工作负载的单节点 OpenShift 集群需要对 CPU 资源进行一致的访问。Operator Lifecycle Manager (OLM) 会定期从 Operator 收集性能数据,从而增加 CPU 利用率。以下 ConfigMap
自定义资源 (CR) 禁用 OLM 的 Operator 性能数据收集。
推荐的集群 OLM 配置 (ReduceOLMFootprint.yaml
)
7.7.12. LVM 存储 复制链接链接已复制到粘贴板!
您可以使用逻辑卷管理器(LVM)存储在单节点 OpenShift 集群上动态置备本地存储。
推荐的单节点 OpenShift 存储解决方案是 Local Storage Operator。另外,您可以使用 LVM Storage,但需要额外的 CPU 资源。
以下 YAML 示例将节点的存储配置为可供 OpenShift Container Platform 应用程序使用。
推荐的 LVMCluster
配置 (StorageLVMCluster.yaml
)
LVMCluster CR 字段 | 描述 |
---|---|
| 配置用于 LVM 存储的磁盘。如果没有指定磁盘,LVM 存储将使用指定精简池中所有未使用的磁盘。 |
7.7.13. 网络诊断 复制链接链接已复制到粘贴板!
运行 DU 工作负载的单节点 OpenShift 集群需要较少的 pod 网络连接检查,以减少这些 pod 创建的额外负载。以下自定义资源 (CR) 禁用这些检查。
推荐的网络诊断配置 (DisableSnoNetworkDiag.yaml
)