第 9 章 监控数据网格服务
Data Grid 会公开 Prometheus 和 Grafana 可以用来监控和视觉化集群状态的指标。
本文档解释了如何在 OpenShift Container Platform 上设置监控。如果您使用社区 Prometheus 部署,可能会找到这些说明作为常规指南。但是,您应该参阅 Prometheus 文档来安装和使用说明。
请参阅 Prometheus Operator 文档。
9.1. 创建 Prometheus 服务监控器 复制链接链接已复制到粘贴板!
Data Grid Operator 会自动创建一个 Prometheus ServiceMonitor,从您的 Data Grid 集群中提取指标。
流程
在 OpenShift Container Platform 上为用户定义的项目启用监控。
当 Operator 检测到 Infinispan CR,并将监控注解设置为 true 时,Data Grid Operator 会执行以下操作:
-
创建名为 <
cluster_name>-monitor的ServiceMonitor。 如果尚未明确设置,请将
infinispan.org/monitoring: 'true'注解添加到InfinispanCR 元数据中:Copy to Clipboard Copied! Toggle word wrap Toggle overflow
为了与 Data Grid 进行身份验证,Prometheus 使用 operator 凭证。
验证
您可以按照以下方法检查 Prometheus 是否提取 Data Grid 指标:
- 在 OpenShift Web 控制台中,选择 < ;/> Developer 视角,然后选择 Monitoring。
- 打开 Data Grid 集群运行的命名空间的 Dashboard 选项卡。
打开 Metrics 选项卡,并确认您可以查询 Data Grid 指标,例如:
vendor_cache_manager_default_cluster_size
vendor_cache_manager_default_cluster_sizeCopy to Clipboard Copied! Toggle word wrap Toggle overflow
9.1.1. 禁用 Prometheus 服务监控器 复制链接链接已复制到粘贴板!
如果您不希望 Prometheus 为 Data Grid 集群提取指标,您可以禁用 ServiceMonitor。
流程
在
InfinispanCR 中将'false'设置为infinispan.org/monitoring注解的值。Copy to Clipboard Copied! Toggle word wrap Toggle overflow - 应用更改。