2.4. vllm bench 参数 在线服务吞吐量基准. $ vllm bench [options] bench positional 参数: 延迟 基准单个请求的延迟。 在线服务吞吐量服务基准。 吞吐量 基准离线推测吞吐量. 前一个下一个