4.4. 在 Jaeger UI 中配置 Monitor 选项卡
您可以在 OpenShift Container Platform Web 控制台的 Monitor 选项卡中通过 Jaeger Console 提取请求率、错误和持续时间(RED)指标,并通过 Jaeger Console 进行视觉化。指标来自 OpenTelemetry Collector 中的 span,由 Prometheus 从 Collector 中提取,您可以在用户工作负载监控堆栈中部署。Jaeger UI 从 Prometheus 端点查询这些指标,并视觉化它们。
先决条件
- 您已为分布式跟踪平台配置了权限和租户。如需更多信息,请参阅"配置权限和租户"。
流程
在
OpenTelemetry Collector
的 OpenTelemetryCollector 自定义资源中,启用 Spanmetrics Connector (spanmetrics
),它将从 trace 派生指标,并以 Prometheus 格式导出指标。span RED 的
OpenTelemetryCollector
自定义资源示例Copy to Clipboard Copied! Toggle word wrap Toggle overflow 在
TempoStack
自定义资源中,启用 Monitor 选项卡,并将 Prometheus 端点设置为 Thanos querier 服务,以从用户定义的监控堆栈查询数据。带有启用 Monitor 选项卡的
TempoStack
自定义资源示例Copy to Clipboard Copied! Toggle word wrap Toggle overflow 可选:使用带有警报规则的
spanmetrics
连接器生成的 span RED 指标。例如,对于有关较慢的服务或定义服务级别目标(SLO)的警报,连接器会创建一个duration_bucket
直方图和调用
计数器指标。这些指标具有标识服务、API 名称、操作类型和其他属性的标签。Expand 表 4.4. 在 spanmetrics 连接器中创建的指标标签 标签 描述 值 service_name
由
otel_service_name
环境变量设置的服务名称。frontend
span_name
操作的名称。
-
/
-
/customer
span_kind
标识服务器、客户端、消息传递或内部操作。
-
SPAN_KIND_SERVER
-
SPAN_KIND_CLIENT
-
SPAN_KIND_PRODUCER
-
SPAN_KIND_CONSUMER
-
SPAN_KIND_INTERNAL
PrometheusRule
自定义资源示例,当前端服务于 2000ms 内没有提供 95% 时 SLO 定义警报规则Copy to Clipboard Copied! Toggle word wrap Toggle overflow - 1
- 这个表达式检查,是否 95% 的前端服务器响应时间值低于 2000 ms。时间范围 (
[5m]
) 必须至少是提取间隔的四倍,并且足以适应指标的变化。
-