2.2. 新しい開発者向け機能

/server_info REST エンドポイント: 可観測性と自動化のためにモデル、KV キャッシュ、デバイス設定をクエリーします。
動的 LoRA ホットリロード: ダウンタイムなしで URL から微調整されたアダプターを交換します。
vllm-bench CLI: 即時のレイテンシーとスループットのサイズ設定を可能にする "コンテナー内出荷ツール"。
より高速な段階的なトークン化解除: CUDA および ROCm GPU では、ストリーミング応答が 2 倍の速さで開始します。
torch.compile キャッシュ: キャッシュされた最初のプロンプトのコンパイルにより、ホストの再起動時のウォームアップ時間が短縮されます。

詳細情報

試用、購入および販売

コミュニティー

会社概要

Red Hat は、企業がコアとなるデータセンターからネットワークエッジに至るまで、各種プラットフォームや環境全体で作業を簡素化できるように、強化されたソリューションを提供しています。

多様性を受け入れるオープンソースの強化

Red Hat では、コード、ドキュメント、Web プロパティーにおける配慮に欠ける用語の置き換えに取り組んでいます。このような変更は、段階的に実施される予定です。詳細情報: Red Hat ブログ.

Red Hat ドキュメントについて

Red Hat をお使いのお客様が、信頼できるコンテンツが含まれている製品やサービスを活用することで、イノベーションを行い、目標を達成できるようにします。最新の更新を見る.

Theme

© 2026 Red Hat

トップに戻る