第 14 章 监控数据网格服务
Data Grid 会公开 Prometheus 和 Grafana 可以用来监控和视觉化集群状态的指标。
本文档解释了如何在 OpenShift Container Platform 上设置监控。如果您使用社区 Prometheus 部署,可能会找到这些说明作为常规指南。但是,您应该参阅 Prometheus 文档来安装和使用说明。
请参阅 Prometheus Operator 文档。
14.1. 创建 Prometheus 服务监控器 复制链接链接已复制到粘贴板!
Data Grid Operator 会自动创建一个 Prometheus ServiceMonitor,从您的 Data Grid 集群中提取指标。
流程
在 OpenShift Container Platform 上为用户定义的项目启用监控。
当 Operator 检测到 Infinispan CR,并将监控注解设置为 true 时,Data Grid Operator 会执行以下操作:
-
创建名为 <
cluster_name>-monitor的ServiceMonitor。 如果尚未明确设置,请将
infinispan.org/monitoring: 'true'注解添加到InfinispanCR 元数据中:Copy to Clipboard Copied! Toggle word wrap Toggle overflow
为了与 Data Grid 进行身份验证,Prometheus 使用 operator 凭证。
验证
您可以按照以下方法检查 Prometheus 是否提取 Data Grid 指标:
- 在 OpenShift Web 控制台中,选择 < ;/> Developer 视角,然后选择 Monitoring。
- 打开 Data Grid 集群运行的命名空间的 Dashboard 选项卡。
打开 Metrics 选项卡,并确认您可以查询 Data Grid 指标,例如:
vendor_cache_manager_default_cluster_size
vendor_cache_manager_default_cluster_sizeCopy to Clipboard Copied! Toggle word wrap Toggle overflow
14.1.1. 禁用 Prometheus 服务监控器 复制链接链接已复制到粘贴板!
如果您不希望 Prometheus 为 Data Grid 集群提取指标,您可以禁用 ServiceMonitor。
流程
在
InfinispanCR 中将'false'设置为infinispan.org/monitoring注解的值。Copy to Clipboard Copied! Toggle word wrap Toggle overflow - 应用更改。
14.1.2. 配置服务监控目标标签 复制链接链接已复制到粘贴板!
您可以使用 ServiceMonitor spec.targetLabels 字段将生成的 ServiceMonitor 配置为将 Service 标签传播到底层指标。使用 Service 标签过滤和聚合从被监控端点收集的指标。
流程
-
通过在
InfinispanCR 中设置infinispan.org/targetLabels注解来定义要应用到您的服务的标签。 在
InfinispanCR 上使用infinispan.org/serviceMonitorTargetLabels注解指定指标所需的以逗号分隔的标签列表。Copy to Clipboard Copied! Toggle word wrap Toggle overflow - 应用更改。