第 12 章 监控
12.1. 监控概述
您可以使用以下工具监控集群和虚拟机 (VM) 的健康状况:
- 监控 OpenShift Virtualization 虚拟机健康状态
-
在 web 控制台中查看 OpenShift Virtualization 环境的整体健康状况,进入到 OpenShift Container Platform Web 控制台中的 Home
Overview 页面。Status 卡根据警报和条件显示 OpenShift Virtualization 的整体健康状况。 - OpenShift Container Platform 集群检查框架
使用 OpenShift Container Platform 集群检查框架在集群中运行自动测试,以检查以下条件:
- 附加到二级网络接口的两个虚拟机之间的网络连接和延迟
- 运行带有零数据包丢失的 Data Plane Development Kit (DPDK) 工作负载的虚拟机
- 为 OpenShift Virtualization 配置集群存储
- Prometheus 对虚拟资源的查询
- 查询 vCPU、网络、存储和客户机内存交换使用情况和实时迁移进度。
- VM 自定义指标
-
配置
node-exporter
服务,以公开内部虚拟机指标和进程。 - VM 健康检查
- 为虚拟机配置就绪度、存活度和客户机代理 ping 探测和 watchdog。
- Runbooks
- 诊断并解决在 OpenShift Container Platform Web 控制台中触发 OpenShift Virtualization 警报的问题。