第 1 章 关于 Observability (可观察性)
Red Hat OpenShift Observability 提供各种系统指标、日志和事件的实时可见性、监控和分析,以帮助用户在影响系统或应用程序前快速诊断并排除问题。为了帮助确保应用程序和基础架构的可靠性、性能和安全性,Red Hat OpenShift Service on AWS 提供了以下 Observability 组件:
- 监控
- 日志记录
Red Hat OpenShift Observability 连接开源可观察性工具和技术,以创建一个统一的 Observability 解决方案。Red Hat OpenShift Observability 组件协同工作,以帮助您收集、存储、交付、分析和视觉化数据。
除了监控外,Red Hat OpenShift Observability 组件与 Red Hat OpenShift Service on AWS 核心发行周期不同。有关其发行版本兼容性,请参阅 Red Hat OpenShift Operator 生命周期页。
1.1. 监控 复制链接链接已复制到粘贴板!
使用指标以及 CPU 和内存用量、网络连接和其他资源使用量自定义警报,监控 Red Hat OpenShift Service on AWS 上运行的应用程序的 in-cluster 健康和性能。监控堆栈组件由 Cluster Monitoring Operator 部署和管理。
监控堆栈组件默认部署在每个 Red Hat OpenShift Service on AWS 安装中,并由 Cluster Monitoring Operator (CMO)管理。这些组件包括 Prometheus、Alertmanager、Thanos Querier 等。CMO 还部署 Telemeter 客户端,该客户端从平台 Prometheus 实例向红帽发送一个部分数据,以便为集群提供远程健康监控。