1.3. 集群管理员活动
管理虚拟机,向用户提供服务,并遵循监控和日志记录报告。本文档可帮助您:
- 了解 OpenShift Container Platform 管理 :了解 OpenShift Container Platform 4.13 control plane 的组件。请参阅 OpenShift Container Platform control plane 和计算节点如何通过 Machine API 和 Operator 进行管理和更新。
- 启用在安装集群管理员前禁用的集群功能,可以启用在安装前禁用的集群功能。如需更多信息,请参阅启用集群功能。
1.3.1. 管理集群组件
- 管理机器: 在带有集群集的集群中管理 compute 和 control plane,使用部署健康检查和应用自动扩展。
- 管理容器 registry :每个 OpenShift Container Platform 集群都包含一个内置容器 registry 来存储其镜像。您还可以配置用于 OpenShift Container Platform 的独立 Red Hat Quay registry。Quay.io 网站提供了一个公共容器 registry,用于存储 OpenShift Container Platform 容器和 Operator。
- 管理用户和组 :添加具有不同级别权限的用户和组,以使用或修改集群。
- 管理身份验证 :了解用户、组和 API 身份验证在 OpenShift Container Platform 中的工作方式。OpenShift Container Platform 支持多个身份提供程序。
- 管理入口(ingress)、API 服务器和 服务证书 :OpenShift Container Platform 默认为 Ingress Operator、API 服务器创建证书,以及需要加密的复杂中间件应用程序所需的服务。您可能需要更改、添加或轮转这些证书。
-
管理网络 :OpenShift Container Platform 中的集群网络由 Cluster Network Operator (CNO)管理。CNO 使用 kube-proxy 中的
iptables
规则来指示在这些节点上运行的节点和 pod 间的流量。Multus Container Network Interface 添加了将多个网络接口附加到 pod 的功能。通过使用 网络策略功能,您可以隔离 pod 或允许所选流量。 - 管理存储 :OpenShift Container Platform 允许管理员使用 Red Hat OpenShift Data Foundation、AWS Elastic Block Store、NFS、iSCSI、Container Storage Interface(CSI) 配置持久性存储。您可以扩展持久性卷,配置动态置备,并使用 CSI 配置、克隆,并使用持久性存储的 快照。
- 管理 Operator :Red Hat, ISV, 和社区 Operators 列表,集群管理员可对其进行审核并在集群上进行安装。安装后,您可以运行、升级、备份或管理集群中的 Operator。
- 了解 Windows 容器工作负载。Red Hat OpenShift for Windows Containers 提供了在 OpenShift Container Platform 集群中运行 Windows 计算节点的功能。这可以通过使用 Red Hat Windows Machine Config Operator(WMCO)来安装和管理 Windows 节点来实现。
1.3.2. 更改集群组件
- 使用自定义资源定义(CRD)修改集群 :通过 Operator 实施的集群功能可使用 CRD 修改。了解如何创建 CRD 并从 CRD 管理资源。
- 设置资源配额 :从 CPU、内存和其他系统资源中选择来设置配额。
- 修剪和回收资源 :通过修剪不需要的 Operator、组、部署、构建、镜像、registry 和 cron 作业来回收空间。
- 扩展和调优集群 :设置集群限制、调整节点、扩展集群监控和优化您的环境的网络、存储和路由。
-
更新集群 :使用 Cluster Version Operator (CVO) 升级 OpenShift Container Platform 集群。如果 OpenShift Update Service (OSUS)提供了更新,您可以通过 OpenShift Container Platform Web 控制台或 OpenShift CLI (
oc
)应用该集群更新。
- 了解 OpenShift Update Service :了解如何安装和管理本地 OpenShift Update Service,以便在断开连接的网络环境中推荐 OpenShift Container Platform 更新。
- 使用 worker 延迟配置集提高高延迟环境中的集群稳定性 :如果您的网络有延迟问题,您可以使用三个 worker 延迟配置集之一来确保 control plane 不会意外驱除 pod,以防它无法访问 worker 节点。您可以在集群生命周期内随时配置或修改配置集。
1.3.3. 监控集群
- 使用 OpenShift Logging :了解 OpenShift Logging 并配置不同的 OpenShift Logging 类型,如 Elasticsearch、Fluentd 和 Kibana。
- Red Hat OpenShift distributed tracing 平台 :存储和视觉化通过分布式系统、整个微服务堆栈和高负载的大量请求。使用分布式追踪平台来监控分布式事务,收集检测服务、网络分析、性能和延迟优化,根本原因分析,并对现代云原生微服务的应用中组件之间的交互进行故障排除。
- 红帽构建的 OpenTelemetry :生成、收集和导出遥测追踪、指标和日志,以分析和了解您的软件性能和行为。使用 Tempo 或 Prometheus 等开源后端,或使用商业产品。了解一组 API 和约定,并拥有您生成的数据。
- Network Observability: 使用 eBPF 技术观察 OpenShift Container Platform 集群的网络流量,以创建和丰富的网络流。您可以查看仪表板、自定义警报,并分析网络流信息,以进一步洞察和故障排除。
- 集群内监控 :了解如何配置监控堆栈。配置监控后,使用 Web 控制台访问监控仪表板。除了基础架构指标外,您还可以提取和查看您自己的服务的指标。
- 远程健康监控:OpenShift Container Platform 会收集有关集群的匿名汇总信息。通过使用 Telemetry 和 Insights Operator,红帽会接收这些数据,用于改进 OpenShift Container Platform。您可以查看远程健康监控收集的数据。