第 7 章 弃用的指标
以下指标已弃用,并将在以后的 AI Inference 服务器版本中删除:
-
vllm:num_requests_swapped
-
vllm:cpu_cache_usage_perc
-
vllm:cpu_prefix_cache_hit_rate
(KV cache offloading 不会在 V1)中使用。 -
vllm:gpu_prefix_cache_hit_rate
.此指标由 V1 中的 queries+hits 计数器替换。 -
vllm:time_in_queue_requests
.此指标由vllm:request_queue_time_seconds
重复。 -
vllm:model_forward_time_milliseconds
-
vllm:model_execute_time_milliseconds
.应改为使用预先填充、解码或推测时间指标。
重要
当指标在 X.Y
中被弃用时,它们会在 X.Y+1
版本中被隐藏,但可以使用-- show-hidden-metrics-for-version=X.Y
转义 Redch 重新启用。弃用的指标将在以下 X.Y+2
版本中完全删除。