第 9 章 监控数据网格服务
Data Grid 会公开 Prometheus 和 Grafana 可以用来监控和视觉化集群状态的指标。
本文档解释了如何在 OpenShift Container Platform 上设置监控。如果您使用社区 Prometheus 部署,可能会找到这些说明作为常规指南。但是,您应该参阅 Prometheus 文档来安装和使用说明。
请参阅 Prometheus Operator 文档。
9.1. 创建 Prometheus 服务监控器 复制链接链接已复制到粘贴板!
Data Grid Operator 会自动创建一个 Prometheus ServiceMonitor
,从您的 Data Grid 集群中提取指标。
流程
在 OpenShift Container Platform 上为用户定义的项目启用监控。
当 Operator 检测到 Infinispan
CR,并将监控注解设置为 true
时,Data Grid Operator 会执行以下操作:
-
创建名为 <
cluster_name>-monitor
的ServiceMonitor
。 如果尚未明确设置,请将
infinispan.org/monitoring: 'true'
注解添加到Infinispan
CR 元数据中:Copy to Clipboard Copied! Toggle word wrap Toggle overflow
为了与 Data Grid 进行身份验证,Prometheus 使用 operator
凭证。
验证
您可以按照以下方法检查 Prometheus 是否提取 Data Grid 指标:
- 在 OpenShift Web 控制台中,选择 < ;/> Developer 视角,然后选择 Monitoring。
- 打开 Data Grid 集群运行的命名空间的 Dashboard 选项卡。
打开 Metrics 选项卡,并确认您可以查询 Data Grid 指标,例如:
vendor_cache_manager_default_cluster_size
vendor_cache_manager_default_cluster_size
Copy to Clipboard Copied! Toggle word wrap Toggle overflow
9.1.1. 禁用 Prometheus 服务监控器 复制链接链接已复制到粘贴板!
如果您不希望 Prometheus 为 Data Grid 集群提取指标,您可以禁用 ServiceMonitor
。
流程
在
Infinispan
CR 中将'false'
设置为infinispan.org/monitoring
注解的值。Copy to Clipboard Copied! Toggle word wrap Toggle overflow - 应用更改。