6.2. Service Telemetry Framework 中的指标保留时间段
在 Service Telemetry Framework (STF)中存储的指标的默认保留时间为 24 小时,它为警报目的提供了足够的数据。
对于长期存储,请使用专为长期数据保留而设计的系统,例如 Thanos。
其他资源
- 要为额外的指标保留时间调整 STF,请参阅 第 6.2.1 节 “在 Service Telemetry Framework 中编辑指标保留时间段”。
- 有关 Prometheus 数据存储和估算存储空间的建议,请参阅 https://prometheus.io/docs/prometheus/latest/storage/#operational-aspects
- 有关 Thanos 的更多信息,请参阅 https://thanos.io/
6.2.1. 在 Service Telemetry Framework 中编辑指标保留时间段
您可以调整 Service Telemetry Framework (STF)以提供额外的指标保留时间。
流程
- 登录到 Red Hat OpenShift Container Platform。
进入 service-telemetry 命名空间:
$ oc project service-telemetry
编辑 ServiceTelemetry 对象:
$ oc edit stf default
将
retention: 7d
添加到 backends.metrics.prometheus.storage 的 storage 部分,将保留周期增加到 7 天:注意如果您设置了较长的保留周期,从大量填充的 Prometheus 系统检索数据可能会导致查询缓慢返回结果。
apiVersion: infra.watch/v1beta1 kind: ServiceTelemetry metadata: name: default namespace: service-telemetry spec: ... backends: metrics: prometheus: enabled: true storage: strategy: persistent retention: 7d ...
- 保存您的更改并关闭对象。
等待 prometheus 使用新设置重启。
$ oc get po -l app.kubernetes.io/name=prometheus -w
通过检查 pod 中使用的命令行参数来验证新的保留设置。
$ oc describe po prometheus-default-0 | grep retention.time --storage.tsdb.retention.time=24h
其他资源
- 有关指标保留时间的更多信息,请参阅 第 6.2 节 “Service Telemetry Framework 中的指标保留时间段”。