第 3 章 通过连接集群进行远程健康监控
3.1. 关于远程健康监控
OpenShift Container Platform 会收集有关集群健康、使用情况和集群大小的匿名聚合信息,并通过两个集成组件(Telemetry 和 Insights Operator)向红帽报告。红帽利用这些信息便可改进 OpenShift Container Platform,并更快地对影响客户的问题做出反应。这还可以简化红帽客户的订阅和授权流程,并使 Red Hat OpenShift Cluster Manager 服务能够提供有关您的集群及其健康和订阅状态的概述信息。
通过 Telemetry 和 Insights Operator 向红帽报告数据的集群被称为连接的集群 (connected cluster)。
3.1.1. 关于 Telemetry
Telemetry 会向红帽发送一组精选的集群监控指标子集。这些指标会持续发送并描述:
- OpenShift Container Platform 集群的大小
- OpenShift Container Platform 组件的健康和状态
- 正在进行的任何升级的健康和状态
- 有关 OpenShift Container Platform 组件和功能的有限使用情况信息
- 有关集群监控组件所报告的警报的摘要信息
红帽将使用这一持续数据流实时监控集群的健康,必要时将对影响客户的问题做出反应。同时还有助于红帽向客户推出 OpenShift Container Platform 升级,以便最大程度降低服务影响,持续改进升级体验。
这类调试信息将提供给红帽支持和工程团队,其访问限制等同于访问通过问题单报告的数据。红帽利用所有连接集群信息来帮助改进 OpenShift Container Platform,提高其易用性。所有这些信息都不会与第三方共享。
3.1.1.1. Telemetry 收集的信息
Telemetry 收集的主要信息包括:
- 每个集群可用的更新数
- 用于更新的频道和镜像仓库
- 更新期间发生的错误数
- 正在运行的更新的进度信息
- 每个集群的机器数
- 机器的 CPU 内核数和 RAM 大小
- etcd 集群中的成员数,以及当前存储在 etcd 集群中的对象数
- 每种机器类型(infra 或 master)使用的 CPU 内核数和 RAM 大小
- 每个集群使用的 CPU 内核数和 RAM 大小
- 每个集群的 OpenShift Container Platform 框架组件的使用情况
- OpenShift Container Platform 集群的版本
- 集群上安装的任何 OpenShift Container Platform 框架组件(如 Cluster Version Operator、Cluster Monitoring、Image Registry、Elasticsearch for Logging)的健康、情况和状态。
- 安装期间生成的随机的唯一标识符
- OpenShift Container Platform 部署平台的名称,如 Amazon Web Services
Telemetry 不会收集任何身份识别的信息,如用户名、密码、用户资源的名称或地址。
3.1.2. 关于 Insights Operator
Insights Operator 会定期收集匿名配置和组件故障状态,并向红帽报告。这类信息是通过 must-gather
工具所收集信息的子集,方便红帽访问重要配置,以及相比 Telemetry 报告来说更深层次的故障数据。这些数据每天分多次发送,其内容包括:
- 有关集群运行环境的重要配置信息
- 有关集群及其主要组件状态的详情
- 有关报告故障的基础架构 pod 或节点的调试信息
这类调试信息将提供给红帽支持和工程团队,其访问限制等同于访问通过问题单报告的数据。红帽利用所有连接集群信息来帮助改进 OpenShift Container Platform,提高其易用性。所有这些信息都不会与第三方共享。
3.1.2.1. Insights Operator 收集的信息
Insights Operator 收集的主要信息包括:
- 集群及其组件的版本以及集群的唯一标识符
- 用于更新的频道和镜像仓库
- 有关集群组件中发生的错误的详情
- 正在运行的更新的进度和健康信息以及任何组件升级的状态
- 有关与红帽支持相关的集群配置的匿名详情
- 有关可能影响红帽支持的任何技术预览或不受支持配置的详情
- 有关 OpenShift Container Platform 部署平台(如 Amazon Web Services)以及集群所在区域的详情
- 有关已降级的 OpenShift Container Platform 集群 Operator 的 pod 的信息
-
标记为
NotReady
的节点的信息 - 为 Degraded operator 列出为 "related objects" 的所有命名空间的事件
- 匿名的证书签名请求 (CSR) 及证书的有效性信息
Insights Operator 不会收集任何身份识别信息,如用户名、密码、用户资源的名称或地址。