第3章 大規模言語モデルのダウンロード
Red Hat Enterprise Linux AI を使用すると、Red Hat と IBM が提供および構築したさまざまな大規模言語モデル (LLM) をカスタマイズしたり、それらとチャットしたりできます。以下のモデルは、Red Hat RHEL AI レジストリーからダウンロードできます。任意のカスタムモデルを S3 バケットにアップロードできます。
| 大規模言語モデル (LLM) | タイプ | サイズ | 目的 | モデルファミリー | NVIDIA アクセラレーターのサポート | AMD Accelerator サポート | Intel Accelerator サポート |
|---|---|---|---|---|---|---|---|
|
| LAB ファインチューニング granite スターターモデル | 16.0 GB | カスタマイズとファインチューニングを行うためのデフォルト Granite 3.1 ベースモデルのバージョン 2 | Granite 3.1 | 一般提供 | 一般提供 | 利用不可 |
|
| LAB によるファインチューニング済み Granite モデル | 16.0 GB | 推論サービング用のデフォルト Granite 3.1 モデルのバージョン 2 | Granite 3.1 | 一般提供 | 一般提供 | 利用不可 |
|
| LAB ファインチューニング granite スターターモデル | 16.0 GB | カスタマイズとファインチューニングを行うためのデフォルト Granite 3.1 ベースモデルのバージョン 2 | Granite 3.1 | 利用不可 | 利用不可 | テクノロジープレビュー |
|
| LAB によるファインチューニング済み Granite モデル | 16.0 GB | 推論サービング用のデフォルト Granite 3.1 モデルのバージョン 2 | Granite 3.1 | 利用不可 | 利用不可 | テクノロジープレビュー |
|
| LAB によるファインチューニング済み Granite コードモデル | 15.0 GB | LAB によるファインチューニング済みの推論サービング用 Granite コードモデル | Granite Code モデル | テクノロジープレビュー | テクノロジープレビュー | テクノロジープレビュー |
|
| Granite によるファインチューニング済みコードモデル | 15.0 GB | 推論サービング用の Granite コードモデル | Granite Code モデル | テクノロジープレビュー | テクノロジープレビュー | テクノロジープレビュー |
|
| デフォルトの教師モデル | 87.0 GB | 合成データ生成 (SDG) を実行するためのデフォルトの教師モデル | Mixtral | 一般提供 | 一般提供 | テクノロジープレビュー |
|
| オプションの教師モデル | 74.0 GB | 合成データ生成 (SDG) を実行するためのオプションの教師モデル | Llama | テクノロジープレビュー | 利用不可 | 利用不可 |
|
| 評価ジャッジモデル | 87.0 GB | 複数フェーズのトレーニングと評価を行うためのジャッジモデル | Prometheus 2 | 一般提供 | 一般提供 | テクノロジープレビュー |
granite-8b-code-instruct または granite-8b-code-base 大規模言語モデル (LLM) の使用は、テクノロジープレビュー機能です。テクノロジープレビュー機能は、Red Hat 製品のサービスレベルアグリーメント (SLA) の対象外であり、機能的に完全ではないことがあります。Red Hat は、実稼働環境でこれらを使用することを推奨していません。テクノロジープレビュー機能は、最新の製品機能をいち早く提供して、開発段階で機能のテストを行い、フィードバックを提供していただくことを目的としています。
Red Hat のテクノロジープレビュー機能のサポート範囲に関する詳細は、テクノロジープレビュー機能のサポート範囲 を参照してください。
Granite LLM のカスタマイズに必要なモデル
-
ハードウェアベンダーに応じた
granite-7b-starterまたはgranite-8b-starter-v1ベース LLM -
SDG 用の
mixtral-8x7b-instruct-v0-1教師モデル -
トレーニングと評価を行うための
prometheus-8x7b-v2-0ジャッジモデル
LLM のカスタマイズに必要な追加のツール
低ランク適応 (LoRA) アダプターは、合成データ生成 (SDG) プロセスの効率を高めます。
-
SDG 用の
skills-adapter-v3LoRA 階層化スキルアダプター SDG 用の
knowledge-adapter-v3LoRA 階層化ナレッジアダプターアダプターをダウンロードするコマンドの例
$ ilab model download --repository docker://registry.redhat.io/rhelai1/knowledge-adapter-v3 --release latest
LoRA 階層化アダプターは、ilab model list コマンドの出力には表示されません。ls ~/.cache/instructlab/models フォルダーに、skills-adapter-v3 ファイルと knowledge-adapter-v3 ファイルが表示されます。
3.1. Red Hat リポジトリーからのモデルのダウンロード リンクのコピーリンクがクリップボードにコピーされました!
Red Hat および IBM が作成した追加のオプションモデルをダウンロードできます。
前提条件
- 起動可能なコンテナーイメージを使用して RHEL AI をインストールしている。
- InstructLab を初期化している。
- Red Hat レジストリーアカウントを作成し、マシンにログインしている。
- マシンの root ユーザーアクセス権がある。
手順
追加の LLM モデルをダウンロードするには、次のコマンドを実行します。
$ ilab model download --repository docker://<repository_and_model> --release <release>ここでは、以下のようになります。
- <repository_and_model>
-
モデルとモデルのリポジトリーのロケーションを指定します。モデルには、
registry.redhat.io/rhelai1/リポジトリーからアクセスできます。 - <release>
-
モデルのバージョンを指定します。RHEL AI バージョン 1.5 でサポートされているモデルの場合は
1.5に設定します。モデルの最新バージョンの場合は、latestに設定します。
コマンドの例
$ ilab model download --repository docker://registry.redhat.io/rhelai1/granite-3.1-8b-starter-v1 --release latest
検証
次のコマンドを使用すると、トレーニング後の新しいモデルなど、ダウンロードしたすべてのモデルをシステム上で表示できます。
$ ilab model list出力例
+-----------------------------------+---------------------+---------+ | Model Name | Last Modified | Size | +-----------------------------------+---------------------+---------+ | models/prometheus-8x7b-v2-0 | 2024-08-09 13:28:50 | 87.0 GB| | models/mixtral-8x7b-instruct-v0-1 | 2024-08-09 13:28:24 | 87.0 GB| | models/granite-3.1-8b-starter-v1 | 2024-08-09 14:28:40 | 16.6 GB| | models/granite-3.1-8b-lab-v1 | 2024-08-09 14:40:35 | 16.6 GB| +-----------------------------------+---------------------+---------+次のコマンドを実行して、
ls ~/.cache/instructlab/modelsフォルダーにダウンロードしたモデルをリスト表示することもできます。$ ls ~/.cache/instructlab/models出力例
granite-3.1-8b-starter-v1 granite-3.1-8b-lab-v1