1.2. 新機能および機能拡張
Red Hat Enterprise Linux AI バージョン 1.2 には、大規模言語モデル (LLM) を微調整するためのさまざまな機能が含まれています。
1.2.1. インストール リンクのコピーリンクがクリップボードにコピーされました!
Red Hat Enterprise Linux AI は起動可能なイメージとしてインストールできます。このイメージには、RHEL AI と対話するためのさまざまなツールが含まれています。またこのイメージには、Red Hat Enterprise Linux 9.4、Python バージョン 3.11、およびモデルの微調整用の InstructLab ツールが含まれています。Red Hat Enterprise Linux AI のインストールの詳細は、インストールの概要 を参照してください。
Red Hat Enterprise Linux AI バージョン 1.2 では、ベアメタル、AWS、IBM Cloud のインストールオプションが継続されます。RHEL AI でサポートされているすべてのインストールオプションは、「インストール機能トラッカー」で確認できます。これらのプラットフォームのハードウェア要件の詳細は、Red Hat Enterprise Linux AI ハードウェア要件 を参照してください。
1.2.1.1. AMD アクセラレーター搭載システムへの RHEL AI のインストール (テクノロジープレビュー) リンクのコピーリンクがクリップボードにコピーされました!
RHEL AI バージョン 1.2 では、テクノロジープレビューとして、AMD アクセラレーターを搭載したマシンに Red Hat Enterprise Linux AI をインストールしてデプロイできるようになりました。RHEL AI は現在、ベアメタルおよび Azure 上の AMD ハードウェアのみをサポートしています。AMD の RHEL AI ハードウェア要件の詳細は、Red Hat Enterprise Linux AI ハードウェア要件 を参照してください。
RHEL AI バージョン 1.2 は現在、AMD ハードウェア用のトレーニングプロファイルを提供していません。config.yaml ファイルを手動で設定し、AMD でのトレーニングに適切なトレーニング設定を追加する必要があります。AMD トレーニングプロファイルを手動で設定する方法の詳細は、AMD アクセラレーターのトレーニングプロファイルの設定 (テクノロジープレビュー) を参照してください。
1.2.1.2. Google Cloud Platform (GCP) への RHEL AI のインストール (テクノロジープレビュー) リンクのコピーリンクがクリップボードにコピーされました!
RHEL AI バージョン 1.2 では、テクノロジープレビューとして、Google Cloud Platform (GCP) インスタンスに Red Hat Enterprise Linux AI をインストールしてデプロイできるようになりました。GCP に Red Hat Enterprise Linux AI をインストールする方法の詳細は、Google Cloud Platform (GCP) へのインストール を参照してください。
RHEL AI は現在、完全なエンドツーエンドのワークフローを実現するために、GCP インスタンス上の 8xA100 および 8xH100 アクセラレーターをサポートしています。GCP インスタンスでの推論用に、Red Hat が提供する LLM を提供することもできます。GCP の RHEL AI ハードウェア要件の詳細は、Red Hat Enterprise Linux AI ハードウェア要件 を参照してください。Red Hat のテクノロジープレビュー機能のサポート範囲に関する詳細は、テクノロジープレビュー機能のサポート範囲 を参照してください。
1.2.1.3. Azure への RHEL AI のインストール (テクノロジープレビュー) リンクのコピーリンクがクリップボードにコピーされました!
テクノロジープレビューとして、Red Hat Enterprise Linux AI バージョン 1.2 を Microsoft Azure にインストールしてデプロイできるようになりました。Azure に Red Hat Enterprise Linux AI をインストールする方法の詳細は、Azure へのインストール を参照してください。
RHEL AI は現在、完全なエンドツーエンドのワークフローを実現するために、Azure インスタンス上の 8xA100 および 8xH100 アクセラレーターをサポートしています。Azure インスタンスでの推論用に、Red Hat が提供する LLM を提供することもできます。AWS の RHEL AI ハードウェア要件の詳細は、Red Hat Enterprise Linux AI ハードウェア要件 を参照してください。Red Hat のテクノロジープレビュー機能のサポート範囲に関する詳細は、テクノロジープレビュー機能のサポート範囲 を参照してください。
1.2.2. RHEL AI 環境の構築 リンクのコピーリンクがクリップボードにコピーされました!
Red Hat Enterprise Linux AI をインストールした後、InstructLab ツールを使用して RHEL AI 環境をセットアップできます。
1.2.2.1. InstructLab の初期化 リンクのコピーリンクがクリップボードにコピーされました!
ilab config init コマンドを実行して、RHEL AI 環境を初期化して設定できます。このコマンドは、RHEL AI と対話し、モデルを微調整するために必要な設定を作成します。また、データファイル用の適切なディレクトリーも作成します。
1.2.2.1.1. ハードウェア自動検出 リンクのコピーリンクがクリップボードにコピーされました!
Red Hat Enterprise Linux AI バージョン 1.2 では、InstructLab の初期化時にハードウェアの自動検出が提供されるようになりました。CLI は、自動検出によってハードウェアが正しく選択されたかどうかを確認するプロンプトを表示し、その後、トレーニングパラメーターを config.yaml ファイルに自動的に追加します。ハードウェアの自動検出の詳細は、InstructLab の初期化 ドキュメントを参照してください。
1.2.2.2. 大規模言語モデルのダウンロード リンクのコピーリンクがクリップボードにコピーされました!
Red Hat が提供するさまざまな大規模言語モデル (LLM) を RHEL AI マシンまたはインスタンスにダウンロードできます。Red Hat レジストリーアカウントを作成してログインすると、Red Hat レジストリーからこれらのモデルをダウンロードできます。サポートされている RHEL AI LLM の詳細は、モデルのダウンロード のドキュメントと「大規模言語モデル (LLM) のテクノロジープレビューステータス」を参照してください。
granite-8b-code-instruct および granite-8b-code-base コードモデルは、RHEL AI バージョン 1.2 で引き続きテクノロジープレビュー機能となっています。Red Hat のテクノロジープレビュー機能のサポート範囲に関する詳細は、テクノロジープレビュー機能のサポート範囲 を参照してください。
1.2.2.3. モデルのサービング (提供) およびモデルとのチャット リンクのコピーリンクがクリップボードにコピーされました!
Red Hat Enterprise Linux AI バージョン 1.2 では、さまざまな LLM 上で vLLM 推論サービングを実行できます。vLLM ツールは、LLM 用のメモリー効率の高い推論およびサービスエンジンライブラリーで、RHEL AI イメージに含まれています。モデルのサービングとモデルとのチャットの詳細は、モデルのサービング (提供) およびモデルとのチャット ドキュメントを参照してください。
Red Hat Enterprise Linux AI では、さまざまなネットワークエンドポイントのカスタマイズを作成できます。モデルのサービング用の API エンドポイントの作成、推論サーバーとしてのマシンのセットアップ、その他のさまざまなオプションが含まれます。これらのカスタマイズの詳細は、モデルを使用したサービングとチャット のドキュメントを参照してください。
1.2.3. RHEL AI での大規模言語モデル (LLM) のカスタマイズ リンクのコピーリンクがクリップボードにコピーされました!
Red Hat Enterprise Linux AI を使用すると、RHEL AI エンドツーエンドのワークフローを使用して granite-7b-starter ベースモデルをカスタマイズおよび微調整できます。
1.2.3.1. IBM Cloud でエンドツーエンドのワークフローを実行する リンクのコピーリンクがクリップボードにコピーされました!
Red Hat Enterprise Linux AI バージョン 1.2 では、IBM Cloud を使用して Granite モデルをカスタマイズし、エンドツーエンドの InstructLab ワークフローを実行できるようになりました。IBM Cloud の RHEL AI エンドツーエンドのハードウェア要件の詳細は、Red Hat Enterprise Linux AI ハードウェア要件 を参照してください。
1.2.3.2. Granite LLM にナレッジデータを追加します。 リンクのコピーリンクがクリップボードにコピーされました!
Red Hat Enterprise Linux AI で、モデルがドメイン固有の情報を学習できるように、タクソノミーツリーをカスタマイズできます。ナレッジデータを Git リポジトリーにホストし、そのデータを使用してモデルを微調整します。RHEL AI ワークフローでは、モデルが学習する質問と回答を含む qna.yaml ファイルを作成します。このファイルは、合成データ生成 (SDG) プロセス、トレーニング、評価を経て、Git リポジトリーと qna.yaml ファイルからのデータを含む新しい LLM を作成します。ナレッジマークダウンと YAML ファイルを作成する方法の詳細なドキュメントは、タクソノミーツリーへのナレッジの追加 を参照してください。
1.2.3.3. 合成データ生成 (SDG) リンクのコピーリンクがクリップボードにコピーされました!
Red Hat Enterprise Linux AI には、LAB で強化された合成データ生成 (SDG) メソッドが含まれています。独自のナレッジデータを含む qna.yaml ファイルを使用して、SDG プロセスで何百もの人工データセットを作成できます。SDG プロセスの実行の詳細は、合成データ生成 (SDG) による新しいデータセットの生成 を参照してください。
1.2.3.4. データを使用したモデルのトレーニング リンクのコピーリンクがクリップボードにコピーされました!
Red Hat Enterprise Linux AI には、LAB で強化されたマルチフェーズトレーニングメソッドが含まれています。これは、データセットを複数のフェーズでトレーニングおよび評価して、可能な限り最適なモデルを作成する微調整ストラテジーです。複数フェーズトレーニングの詳細は、モデルでのデータのトレーニング を参照してください。
1.2.3.4.1. Fully Sharded Data Parallels (FSDP) CPU オフロードによるトレーニング リンクのコピーリンクがクリップボードにコピーされました!
Red Hat Enterprise Linux AI バージョン 1.2 では、PyTorch の Fully Sharded Data Parallels (FSDP) ツールがサポートされるようになりました。RHEL AI でのトレーニング実行中に FSDP を使用できるようになりました。
1.2.3.4.2. トレーニング実行の継続 リンクのコピーリンクがクリップボードにコピーされました!
Red Hat Enterprise Linux AI バージョン 1.2 では、マルチフェーズのトレーニング中に失敗した可能性のあるトレーニング実行を継続できるようになりました。以前のマルチフェーズトレーニング実行中に生成された YAML ファイルを指す、現在サポートされている --training-journal フラグを使用して ilab model train コマンドを実行することで、トレーニング実行を継続できます。これにより、すでに生成されたトレーニングデータが取得され、そのデータを使用してトレーニングが継続されます。トレーニングの継続に関する詳細は、トレーニング実行の継続 を参照してください。
1.2.3.5. ベンチマーク評価 リンクのコピーリンクがクリップボードにコピーされました!
Red Hat Enterprise Linux AI には、新しくトレーニングされたモデルに対してベンチマーク評価を実行する機能が含まれています。トレーニング済みのモデルでは、MMLU_BRANCH ベンチマークを使用して追加したモデルをどの程度認識しているかを評価できます。ベンチマーク評価の詳細は、新しいモデルの評価 を参照してください。