第 8 章 配置 OpenTelemetry Collector 指标
以下列表显示了其中一些指标:
- 收集器内存用量
- CPU 使用率
- 处理活跃追踪和 span 的数量
- 丢弃范围、日志或指标
- 导出器和接收器统计
红帽构建的 OpenTelemetry Operator 会自动创建一个名为 <instance_name>-collector-monitoring
的服务,该服务会公开 Collector 的内部指标。默认情况下,该服务侦听端口 8888
。
您可以使用这些指标来监控 Collector 的性能、资源消耗和其他内部行为。您还可以使用 Prometheus 实例或其他监控工具从上述 <instance_name>-collector-monitoring
服务中提取这些指标。
当 OpenTelemetryCollector
自定义资源 (CR) 中的 spec.observability.metrics.enableMetrics
字段设置为 true
时,OpenTelemetryCollector
CR 会自动创建一个 Prometheus ServiceMonitor
或 PodMonitor
CR,以便 Prometheus 提取您的指标。
先决条件
- 在集群中启用对用户定义的项目的监控。
流程
要启用 OpenTelemetry Collector 实例的指标,请将
spec.observability.metrics.enableMetrics
字段设置为true
:apiVersion: opentelemetry.io/v1alpha1 kind: OpenTelemetryCollector metadata: name: <name> spec: observability: metrics: enableMetrics: true
验证
您可以使用 Web 控制台的 Administrator 视图来验证配置是否成功:
-
进入 Observe
Targets。 - 根据 Source: User 过滤。
-
检查
opentelemetry-collector-<instance_name>
格式的 ServiceMonitor 或 PodMonitor 是否具有 Up 状态。
其他资源