第 6 章 弃用的指标
以下指标已弃用,并将在以后的 AI Inference 服务器版本中删除:
-
vllm:num_requests_swapped -
vllm:cpu_cache_usage_perc -
vllm:cpu_prefix_cache_hit_rate(KV cache offloading 不会在 V1)中使用。 -
vllm:gpu_prefix_cache_hit_rate.此指标由 V1 中的 queries+hits 计数器替换。 -
vllm:time_in_queue_requests.此指标由vllm:request_queue_time_seconds重复。 -
vllm:model_forward_time_milliseconds -
vllm:model_execute_time_milliseconds.应改为使用预先填充、解码或推测时间指标。
重要
当指标在 X.Y 中被弃用时,它们会在 X.Y+1 版本中被隐藏,但可以使用-- show-hidden-metrics-for-version=X.Y 转义 Redch 重新启用。弃用的指标将在以下 X.Y+2 版本中完全删除。