第 14 章 监控 Data Grid 服务
Data Grid 会公开指标数据,供 Prometheus 和 Grafana 用于监控和视觉化集群状态。
本文档解释了如何在 OpenShift Container Platform 中设置监控。如果您正在使用社区 Prometheus 部署,您可能会发现这些说明作为一个常规指南很有用。但是,您应该参阅 Prometheus 文档以了解安装和使用说明。
请参阅 Prometheus Operator 文档。
14.1. 创建 Prometheus 服务监控器 复制链接链接已复制到粘贴板!
data Grid Operator 会自动创建一个 Prometheus ServiceMonitor
,从您的 Data Grid 集群中提取指标。
流程
在 OpenShift Container Platform 上为用户定义的项目启用监控。
当 Operator 检测到 Infinispan
CR 时,监控注解设置为 true
时,Data Grid Operator 会进行以下操作:
-
创建名为 <
cluster_name>-monitor
的ServiceMonitor
。 如果还没有显式设置值,将
infinispan.org/monitoring: 'true'
注解添加到Infinispan
CR 元数据中:Copy to Clipboard Copied! Toggle word wrap Toggle overflow
要通过 Data Grid 进行身份验证,Prometheus 使用 operator
凭证。
验证
您可以检查 Prometheus 是否提取 Data Grid 指标,如下所示:
- 在 OpenShift Web 控制台中,选择 < ;/> Developer 视角,然后选择 Monitoring。
- 为您的 Data Grid 集群运行的命名空间打开 Dashboard 标签页。
打开 Metrics 选项卡,并确认您可以查询 Data Grid 指标,例如:
vendor_cache_manager_default_cluster_size
vendor_cache_manager_default_cluster_size
Copy to Clipboard Copied! Toggle word wrap Toggle overflow
14.1.1. 禁用 Prometheus 服务监控器 复制链接链接已复制到粘贴板!
如果您不希望 Prometheus 为 Data Grid 集群提取指标,可以禁用 ServiceMonitor
。
流程
在
Infinispan
CR 中,将'false'
设置为infinispan.org/monitoring
注解的值。Copy to Clipboard Copied! Toggle word wrap Toggle overflow - 应用更改。