第 6 章弃用的指标

以下指标已弃用，并将在以后的 AI Inference 服务器版本中删除：

vllm:num_requests_swapped
vllm:cpu_cache_usage_perc
vllm:cpu_prefix_cache_hit_rate (KV cache offloading 不会在 V1)中使用。
vllm:gpu_prefix_cache_hit_rate.此指标由 V1 中的 queries+hits 计数器替换。
vllm:time_in_queue_requests.此指标由 vllm:request_queue_time_seconds 重复。
vllm:model_forward_time_milliseconds
vllm:model_execute_time_milliseconds.应改为使用预先填充、解码或推测时间指标。

重要

当指标在 X.Y 中被弃用时，它们会在 X.Y+1 版本中被隐藏，但可以使用-- show-hidden-metrics-for-version=X.Y 转义 Redch 重新启用。弃用的指标将在以下 X.Y+2 版本中完全删除。

学习

尝试、购买和销售

社区

關於紅帽

我们提供强化的解决方案，使企业能够更轻松地跨平台和环境（从核心数据中心到网络边缘）工作。

让开源更具包容性

红帽致力于替换我们的代码、文档和 Web 属性中存在问题的语言。欲了解更多详情，请参阅红帽博客.

关于红帽文档

通过我们的产品和服务，以及可以信赖的内容，帮助红帽用户创新并实现他们的目标。了解我们当前的更新.

Theme

© 2026 Red Hat

返回顶部