第1章バージョン 3.2.1 リリースノート

Red Hat AI Inference Server 3.2.1 リリースは、NVIDIA CUDA、AMD ROCm、および Google TPU AI アクセラレーター向けの大規模言語モデル (LLM) を使用して推論を最適化するコンテナーイメージを提供します。コンテナーイメージは、registry.redhat.io から入手できます。

registry.redhat.io/rhaiis/vllm-cuda-rhel9:3.2.1
registry.redhat.io/rhaiis/vllm-rocm-rhel9:3.2.1
registry.redhat.io/rhaiis/vllm-tpu-rhel9:3.2.1

Red Hat AI Inference Server 3.2.1 には、アップストリーム vLLM v0.10.0 リリースがパッケージ化されています。

更新の完全なリストは、アップストリームの vLLM v0.10.0 リリースノートで確認できます。

注記

Red Hat AI Inference Server 3.2.1 リリースには LLM Compressor がパッケージ化されていません。AI Inference Server で LLM Compressor を使用するには、以前の 3.2.0 コンテナーイメージをプルします。

Red Hat AI Inference Server でサポートされる製品とハードウェア設定が拡張されました。詳細はサポートされている製品およびハードウェア設定を参照してください。

1.1. 新しいモデルが有効に
リンクのコピー

Red Hat AI Inference Server 3.2.1 は、vLLM v0.10.0 の Red Hat AI Inference Server 3.2.1 で使用できるように、以下の新しく検証されたモデルを有効にすることで機能を拡張します。

EAGLE サポート付き Llama 4
EXAONE 4.0
Microsoft Phi‑4‑mini‑flash‑reasoning
Hunyuan V1 Dense + A13B (推論およびツール解析機能を含む)
Ling mixture-of-experts (MoE) モデル
JinaVL Reranker
Nemotron‑Nano‑VL‑8B‑V1
Arcee
Voxtral

第1章バージョン 3.2.1 リリースノート

1.1. 新しいモデルが有効に
リンクのコピー

詳細情報

試用、購入および販売

コミュニティー

Red Hat ドキュメントについて

多様性を受け入れるオープンソースの強化

会社概要

Theme

Red Hat legal and privacy links

Red Hat legal and privacy links

第1章 バージョン 3.2.1 リリースノート

1.1. 新しいモデルが有効にリンクのコピーリンクがクリップボードにコピーされました!

詳細情報

試用、購入および販売

コミュニティー

Red Hat ドキュメントについて

多様性を受け入れるオープンソースの強化

会社概要

Theme

Red Hat legal and privacy links

Red Hat legal and privacy links

第1章バージョン 3.2.1 リリースノート

1.1. 新しいモデルが有効に
リンクのコピー