第 7 章 弃用的指标


以下指标已弃用,并将在以后的 AI Inference 服务器版本中删除:

  • vllm:num_requests_swapped
  • vllm:cpu_cache_usage_perc
  • vllm:cpu_prefix_cache_hit_rate (KV cache offloading 不会在 V1)中使用。
  • vllm:gpu_prefix_cache_hit_rate.此指标由 V1 中的 queries+hits 计数器替换。
  • vllm:time_in_queue_requests.此指标由 vllm:request_queue_time_seconds 重复。
  • vllm:model_forward_time_milliseconds
  • vllm:model_execute_time_milliseconds.应改为使用预先填充、解码或推测时间指标。
重要

当指标在 X.Y 中被弃用时,它们会在 X.Y+1 版本中被隐藏,但可以使用-- show-hidden-metrics-for-version=X.Y 转义 Redch 重新启用。弃用的指标将在以下 X.Y+2 版本中完全删除。

返回顶部
Red Hat logoGithubredditYoutubeTwitter

学习

尝试、购买和销售

社区

关于红帽文档

通过我们的产品和服务,以及可以信赖的内容,帮助红帽用户创新并实现他们的目标。 了解我们当前的更新.

让开源更具包容性

红帽致力于替换我们的代码、文档和 Web 属性中存在问题的语言。欲了解更多详情,请参阅红帽博客.

關於紅帽

我们提供强化的解决方案,使企业能够更轻松地跨平台和环境(从核心数据中心到网络边缘)工作。

Theme

© 2025 Red Hat