2.6. vllm run-batch 参数


为指定模型运行批处理 inference 作业。

$ vllm run-batch
Copy to Clipboard Toggle word wrap
--disable-log-requests

禁用日志记录请求。

默认 :False

--disable-log-stats

禁用日志记录统计信息。

默认 :False

--enable-metrics

启用 Prometheus 指标。

默认 :False

--enable-prompt-tokens-details

当设置为 True 时,启用 prompt_tokens_details 用量。

默认 :False

--max-log-len MAX_LOG_LEN

日志中打印的最大提示字符数或提示 ID 号。

默认 : unlimited

--output-tmp-dir OUTPUT_TMP_DIR

要存储输出文件的目录,然后上传到输出 URL。

默认 : None

--port PORT

Prometheus 指标服务器的端口号。仅在设置 enable-metrics 时才需要。

默认 : 8000

--response-role RESPONSE_ROLE

如果 request.add_generation_prompt=True 则返回的角色名称。

默认 助手

--url URL

Prometheus 指标服务器 URL。仅在设置了 enable-metrics 时才需要。

默认 : 0.0.0.0

--use-v2-block-manager

弃用。块管理器 v1 已被删除。SelfAttnBlockSpaceManager (块管理器 v2)现在是默认的。将 --use-v2-block-manager 标志设置为 True 或 False 对 vLLM 行为没有影响。

默认 :True

-I INPUT_FILE, --input-file INPUT_FILE

单个输入文件的路径或 URL。支持本地文件路径和 HTTP 或 HTTPS。如果指定了 URL,则该文件应该可使用 HTTP GET 可用。

默认 : None

-o OUTPUT_FILE, --output-file OUTPUT_FILE

单个输出文件的路径或 URL。支持本地文件路径和 HTTP 或 HTTPS。如果指定了 URL,则该文件应当可使用 HTTP PUT 可用。

默认 : None

返回顶部
Red Hat logoGithubredditYoutubeTwitter

学习

尝试、购买和销售

社区

关于红帽文档

通过我们的产品和服务,以及可以信赖的内容,帮助红帽用户创新并实现他们的目标。 了解我们当前的更新.

让开源更具包容性

红帽致力于替换我们的代码、文档和 Web 属性中存在问题的语言。欲了解更多详情,请参阅红帽博客.

關於紅帽

我们提供强化的解决方案,使企业能够更轻松地跨平台和环境(从核心数据中心到网络边缘)工作。

Theme

© 2025 Red Hat