2.4. vllm bench 参数 在线服务吞吐量基准. vllm bench [options] $ vllm bench [options] Copy to Clipboard Copied! Toggle word wrap Toggle overflow bench positional 参数: 延迟 基准单个请求的延迟。 在线服务吞吐量服务基准。 吞吐量 基准离线推测吞吐量. 前一个下一个