3.12. etcd 对等往返时间如何影响性能


etcd peer 往返时间是一个端到端测试指标,它包括了如何在成员间复制内容的速度。它显示了 etcd 在所有 etcd 成员间复制客户端请求的延迟。etcd peer 往返时间与网络往返时间不同。

您可以在 OpenShift Container Platform 控制台中监控仪表板上的各种 etcd 指标。在控制台中,点 Observe Dashboards,然后从下拉列表中选择 etcd

etcd 仪表板的末尾,您可以找到一个图表,以汇总 etcd peer 往返时间。

注意

这些 etcd 指标由 Prometheus 中的 OpenShift 指标系统收集。您可以按照红帽知识库解决方案、如何从命令行 Prometheus 统计信息通过 CLI 访问它们。

# Get token to connect to Prometheus
SECRET=$(oc get secret -n openshift-user-workload-monitoring | grep  prometheus-user-workload-token | head -n 1 | awk '{print $1 }')
export TOKEN=$(oc get secret $SECRET -n openshift-user-workload-monitoring -o json | jq -r '.data.token' | base64 -d)
export THANOS_QUERIER_HOST=$(oc get route thanos-querier -n openshift-monitoring -o json | jq -r '.spec.host')
Copy to Clipboard Toggle word wrap

查询必须采用 URL 编码。以下示例演示了如何检索报告 etcd 的往返时间(以秒为单位)的指标,以完成在成员间复制客户端请求:

# prometheus query
query="histogram_quantile(0.99, rate(etcd_network_peer_round_trip_time_seconds_bucket[5m]))"

# urlencoded query
encoded_query=$(printf "%s" $query |jq -sRr @uri)

# querying the OpenShift metrics service
curl -s -X GET -k -H "Authorization: Bearer $TOKEN" "https://$THANOS_QUERIER_HOST/api/v1/query?query=$encoded_query" | jq '.data.result[] | .metric.pod,.value[1]'

"etcd-m2"
"0.09318400000000004"   # example ~93ms
"etcd-m0"
"0.050688"              # example ~51ms
"etcd-m1"
"0.050688"              # example ~51ms
Copy to Clipboard Toggle word wrap

以下指标也与了解 etcd 性能相关:

etcd_disk_wal_fsync_duration_seconds_bucket
报告 etcd WAL fsync 持续时间。
etcd_disk_backend_commit_duration_seconds_bucket
报告 etcd 后端提交延迟持续时间。
etcd_server_leader_changes_seen_total
报告领导变化。
返回顶部
Red Hat logoGithubredditYoutubeTwitter

学习

尝试、购买和销售

社区

关于红帽文档

通过我们的产品和服务,以及可以信赖的内容,帮助红帽用户创新并实现他们的目标。 了解我们当前的更新.

让开源更具包容性

红帽致力于替换我们的代码、文档和 Web 属性中存在问题的语言。欲了解更多详情,请参阅红帽博客.

關於紅帽

我们提供强化的解决方案,使企业能够更轻松地跨平台和环境(从核心数据中心到网络边缘)工作。

Theme

© 2025 Red Hat