2.6. vllm run-batch 引数
指定されたモデルのバッチ推論ジョブを実行します。
vllm run-batch
$ vllm run-batch
- --disable-log-requests
ログ要求を無効にします。
デフォルト: False
- --disable-log-stats
統計のログ記録を無効にします。
デフォルト: False
- --enable-metrics
Prometheus メトリクスを有効にします。
デフォルト: False
- --enable-prompt-tokens-details
True に設定すると、
prompt_tokens_details
の使用が有効になります。デフォルト: False
- --max-log-len MAX_LOG_LEN
ログに出力されるプロンプト文字またはプロンプト ID 番号の最大数。
デフォルト: Unlimited
- --output-tmp-dir OUTPUT_TMP_DIR
出力 URL にアップロードする前に出力ファイルを保存するディレクトリー。
デフォルト: None
- --port PORT
Prometheus メトリクスサーバーのポート番号。
enable-metrics
が設定されている場合にのみ必要です。デフォルト: 8000
- --response-role RESPONSE_ROLE
request.add_generation_prompt=True
の場合に返されるロール名。デフォルト: assistant
- --url URL
Prometheus メトリクスサーバーの URL。
enable-metrics
が設定されている場合にのみ必要です。デフォルト: 0.0.0.0
- --use-v2-block-manager
非推奨。ブロックマネージャー v1 は削除されました。
SelfAttnBlockSpaceManager
(ブロックマネージャー v2) がデフォルトになりました。--use-v2-block-manager
フラグを True または False に設定しても、vLLM の動作には影響しません。デフォルト: True
- -i INPUT_FILE, --input-file INPUT_FILE
単一の入力ファイルへのパスまたは URL。ローカルファイルパスと HTTP または HTTPS をサポートします。URL が指定されている場合、ファイルは HTTP GET 経由で利用できる必要があります。
デフォルト: None
- -o OUTPUT_FILE, --output-file OUTPUT_FILE
単一の出力ファイルへのパスまたは URL。ローカルファイルパスと HTTP または HTTPS をサポートします。URL が指定されている場合、ファイルは HTTP PUT を使用して利用できる必要があります。
デフォルト: None