2.6. vllm run-batch 参数

为指定模型运行批处理 inference 作业。

$ vllm run-batch

--disable-log-requests

禁用日志记录请求。

默认：False

--disable-log-stats

禁用日志记录统计信息。

默认：False

--enable-metrics

启用 Prometheus 指标。

默认：False

--enable-prompt-tokens-details

当设置为 True 时，启用 prompt_tokens_details 用量。

默认：False

--max-log-len MAX_LOG_LEN

日志中打印的最大提示字符数或提示 ID 号。

默认： unlimited

--output-tmp-dir OUTPUT_TMP_DIR

要存储输出文件的目录，然后上传到输出 URL。

默认： None

--port PORT

Prometheus 指标服务器的端口号。仅在设置 enable-metrics 时才需要。

默认： 8000

--response-role RESPONSE_ROLE

如果 request.add_generation_prompt=True 则返回的角色名称。

默认助手

--url URL

Prometheus 指标服务器 URL。仅在设置了 enable-metrics 时才需要。

默认： 0.0.0.0

--use-v2-block-manager

弃用。块管理器 v1 已被删除。SelfAttnBlockSpaceManager （块管理器 v2）现在是默认的。将 --use-v2-block-manager 标志设置为 True 或 False 对 vLLM 行为没有影响。

默认：True

-I INPUT_FILE, --input-file INPUT_FILE

单个输入文件的路径或 URL。支持本地文件路径和 HTTP 或 HTTPS。如果指定了 URL，则该文件应该可使用 HTTP GET 可用。

默认： None

-o OUTPUT_FILE, --output-file OUTPUT_FILE

单个输出文件的路径或 URL。支持本地文件路径和 HTTP 或 HTTPS。如果指定了 URL，则该文件应当可使用 HTTP PUT 可用。

默认： None