第 1 章 关于 Observability (可观察性)
Red Hat OpenShift Observability 提供各种系统指标、日志、追踪和事件的实时可见性、监控和分析,以帮助用户在影响系统或应用程序前快速诊断和排除问题。为了帮助确保应用程序和基础架构的可靠性、性能和安全性,OpenShift Container Platform 提供了以下 Observability 组件:
- 监控
- 日志记录
- 分布式追踪
- Red Hat build of OpenTelemetry
- Network Observability(网络可观察性)
Red Hat OpenShift Observability 连接开源可观察性工具和技术,以创建一个统一的 Observability 解决方案。Red Hat OpenShift Observability 组件协同工作,以帮助您收集、存储、交付、分析和视觉化数据。
除了监控外,Red Hat OpenShift Observability 组件与 OpenShift Container Platform 核心发行周期不同。有关其发行版本兼容性,请参阅 Red Hat OpenShift Operator 生命周期页面。
1.1. 监控
监控 OpenShift Container Platform 上运行的应用程序的集群运行状况和性能,以及自定义 CPU 和内存用量、网络连接和其他资源使用量的警报。监控堆栈组件由 Cluster Monitoring Operator 部署和管理。
监控堆栈组件会在每次 OpenShift Container Platform 安装中部署,并由 Cluster Monitoring Operator (CMO)管理。这些组件包括 Prometheus、Alertmanager、Thanos Querier 等。CMO 还部署 Telemeter 客户端,该客户端从平台 Prometheus 实例向红帽发送一个部分数据,以便为集群提供远程健康监控。