12.8. 为红帽支持收集数据
当您向红帽支持 提交支持问题单 时,使用以下工具为 OpenShift Container Platform 和 OpenShift Virtualization 提供调试信息会很有帮助:
- must-gather 工具
-
must-gather
工具收集诊断信息,包括资源定义和服务日志。 - Prometheus
- Prometheus 是一个时间序列数据库和用于指标的规则评估引擎。Prometheus 将警报发送到 Alertmanager 进行处理。
- Alertmanager
- Alertmanager 服务处理从 Prometheus 接收的警报。Alertmanager 还负责将警报发送到外部通知系统。
12.8.1. 收集环境数据
收集环境数据将最大程度缩短分析并确定根本原因所需的时间。
先决条件
- 将 Prometheus 指标数据的保留时间设置为最少 7 天。
- 配置 Alertmanager 以捕获相关警报并将其发送到专用邮箱,以便可以在集群外查看并保留它们。
- 记录受影响的节点和虚拟机的确切数量。
流程
-
使用默认的
must-gather
镜像收集集群的must-gather
数据。 -
如果需要,为 Red Hat OpenShift Container Storage 收集
must-gather
数据。 -
使用 OpenShift Virtualization
must-gather
镜像收集 OpenShift Virtualization 的must-gather
数据。 - 收集集群的 Prometheus 指标。
12.8.1.1. 其他资源
- 为 Prometheus 指标数据配置 保留时间
- 配置 Alertmanager 将 警报通知 发送到外部系统
-
为 OpenShift Container Platform收集
must-gather
数据 -
为 OpenShift Virtualization收集
must-gather
数据 - 以集群管理员身份为 所有项目 收集 Prometheus 指标