1.2. Hugging Face で検証済みのモデル - 2025 年 5 月のコレクション
RedHat AI on Hugging Face から入手可能な以下のモデルは、Red Hat AI Inference Server での使用が検証されています。
| モデル | 量子化バリアント | Hugging Face モデルカード | 検証環境 |
|---|---|---|---|
| gemma-2-9b-it | FP8 |
| |
| granite-3.1-8b-base | INT4 |
| |
| granite-3.1-8b-instruct | INT4、INT8、FP8 |
| |
| Llama-3.1-8B-Instruct | なし |
| |
| Llama-3.1-Nemotron-70B-Instruct-HF | FP8 |
| |
| Llama-3.3-70B-Instruct | INT4、INT8、FP8 |
| |
| Llama-4-Maverick-17B-128E-Instruct | FP8 |
| |
| Llama-4-Scout-17B-16E-Instruct | INT4、FP8 |
| |
| Meta-Llama-3.1-8B-Instruct | INT4、INT8、FP8 |
| |
| Mistral-Small-24B-Instruct-2501 | INT4、INT8、FP8 |
| |
| Mistral-Small-3.1-24B-Instruct-2503 | INT4、INT8、FP8 |
| |
| Mixtral-8x7B-Instruct-v0.1 | なし |
| |
| phi-4 | INT4、INT8、FP8 |
| |
| Qwen2.5-7B-Instruct | INT4、INT8、FP8 |
|