2.6. vllm run-batch 引数


指定されたモデルのバッチ推論ジョブを実行します。

$ vllm run-batch
Copy to Clipboard Toggle word wrap
--disable-log-requests

ログ要求を無効にします。

デフォルト: False

--disable-log-stats

統計のログ記録を無効にします。

デフォルト: False

--enable-metrics

Prometheus メトリクスを有効にします。

デフォルト: False

--enable-prompt-tokens-details

True に設定すると、prompt_tokens_details の使用が有効になります。

デフォルト: False

--max-log-len MAX_LOG_LEN

ログに出力されるプロンプト文字またはプロンプト ID 番号の最大数。

デフォルト: Unlimited

--output-tmp-dir OUTPUT_TMP_DIR

出力 URL にアップロードする前に出力ファイルを保存するディレクトリー。

デフォルト: None

--port PORT

Prometheus メトリクスサーバーのポート番号。enable-metrics が設定されている場合にのみ必要です。

デフォルト: 8000

--response-role RESPONSE_ROLE

request.add_generation_prompt=True の場合に返されるロール名。

デフォルト: assistant

--url URL

Prometheus メトリクスサーバーの URL。enable-metrics が設定されている場合にのみ必要です。

デフォルト: 0.0.0.0

--use-v2-block-manager

非推奨。ブロックマネージャー v1 は削除されました。SelfAttnBlockSpaceManager (ブロックマネージャー v2) がデフォルトになりました。--use-v2-block-manager フラグを True または False に設定しても、vLLM の動作には影響しません。

デフォルト: True

-i INPUT_FILE, --input-file INPUT_FILE

単一の入力ファイルへのパスまたは URL。ローカルファイルパスと HTTP または HTTPS をサポートします。URL が指定されている場合、ファイルは HTTP GET 経由で利用できる必要があります。

デフォルト: None

-o OUTPUT_FILE, --output-file OUTPUT_FILE

単一の出力ファイルへのパスまたは URL。ローカルファイルパスと HTTP または HTTPS をサポートします。URL が指定されている場合、ファイルは HTTP PUT を使用して利用できる必要があります。

デフォルト: None

トップに戻る
Red Hat logoGithubredditYoutubeTwitter

詳細情報

試用、購入および販売

コミュニティー

Red Hat ドキュメントについて

Red Hat をお使いのお客様が、信頼できるコンテンツが含まれている製品やサービスを活用することで、イノベーションを行い、目標を達成できるようにします。 最新の更新を見る.

多様性を受け入れるオープンソースの強化

Red Hat では、コード、ドキュメント、Web プロパティーにおける配慮に欠ける用語の置き換えに取り組んでいます。このような変更は、段階的に実施される予定です。詳細情報: Red Hat ブログ.

会社概要

Red Hat は、企業がコアとなるデータセンターからネットワークエッジに至るまで、各種プラットフォームや環境全体で作業を簡素化できるように、強化されたソリューションを提供しています。

Theme

© 2025 Red Hat