第 11 章 监控
11.1. 监控概述
您可以使用以下工具监控集群和虚拟机 (VM) 的健康状况:
- 监控 OpenShift Virtualization 虚拟机健康状态
-
在 web 控制台中查看 OpenShift Virtualization 环境的整体健康状况,方法是进入到 Red Hat OpenShift Service on AWS Web 控制台中的 Home
Overview 页面。Status 卡根据警报和条件显示 OpenShift Virtualization 的整体健康状况。
- Prometheus 对虚拟资源的查询
- 查询 vCPU、网络、存储和客户机内存交换使用情况和实时迁移进度。
- VM 自定义指标
-
配置
node-exporter
服务,以公开内部虚拟机指标和进程。 - VM 健康检查
- 为虚拟机配置就绪度、存活度和客户机代理 ping 探测和 watchdog。
- Runbooks
- 诊断并解决在 Red Hat OpenShift Service on AWS Web 控制台中触发 OpenShift Virtualization 警报 的问题。