1.2. 新機能および機能拡張

Red Hat Enterprise Linux AI バージョン 1.2 には、大規模言語モデル (LLM) を微調整するためのさまざまな機能が含まれています。

1.2.1. インストール
リンクのコピー

Red Hat Enterprise Linux AI は起動可能なイメージとしてインストールできます。このイメージには、RHEL AI と対話するためのさまざまなツールが含まれています。またこのイメージには、Red Hat Enterprise Linux 9.4、Python バージョン 3.11、およびモデルの微調整用の InstructLab ツールが含まれています。Red Hat Enterprise Linux AI のインストールの詳細は、インストールの概要を参照してください。

Red Hat Enterprise Linux AI バージョン 1.2 では、ベアメタル、AWS、IBM Cloud のインストールオプションが継続されます。RHEL AI でサポートされているすべてのインストールオプションは、「インストール機能トラッカー」で確認できます。これらのプラットフォームのハードウェア要件の詳細は、Red Hat Enterprise Linux AI ハードウェア要件を参照してください。

1.2.1.1. AMD アクセラレーター搭載システムへの RHEL AI のインストール (テクノロジープレビュー)
リンクのコピー

RHEL AI バージョン 1.2 では、テクノロジープレビューとして、AMD アクセラレーターを搭載したマシンに Red Hat Enterprise Linux AI をインストールしてデプロイできるようになりました。RHEL AI は現在、ベアメタルおよび Azure 上の AMD ハードウェアのみをサポートしています。AMD の RHEL AI ハードウェア要件の詳細は、Red Hat Enterprise Linux AI ハードウェア要件を参照してください。

RHEL AI バージョン 1.2 は現在、AMD ハードウェア用のトレーニングプロファイルを提供していません。config.yaml ファイルを手動で設定し、AMD でのトレーニングに適切なトレーニング設定を追加する必要があります。AMD トレーニングプロファイルを手動で設定する方法の詳細は、AMD アクセラレーターのトレーニングプロファイルの設定 (テクノロジープレビュー) を参照してください。

1.2.1.2. Google Cloud Platform (GCP) への RHEL AI のインストール (テクノロジープレビュー)
リンクのコピー

RHEL AI バージョン 1.2 では、テクノロジープレビューとして、Google Cloud Platform (GCP) インスタンスに Red Hat Enterprise Linux AI をインストールしてデプロイできるようになりました。GCP に Red Hat Enterprise Linux AI をインストールする方法の詳細は、Google Cloud Platform (GCP) へのインストールを参照してください。

RHEL AI は現在、完全なエンドツーエンドのワークフローを実現するために、GCP インスタンス上の 8xA100 および 8xH100 アクセラレーターをサポートしています。GCP インスタンスでの推論用に、Red Hat が提供する LLM を提供することもできます。GCP の RHEL AI ハードウェア要件の詳細は、Red Hat Enterprise Linux AI ハードウェア要件を参照してください。Red Hat のテクノロジープレビュー機能のサポート範囲に関する詳細は、テクノロジープレビュー機能のサポート範囲を参照してください。

1.2.1.3. Azure への RHEL AI のインストール (テクノロジープレビュー)
リンクのコピー

テクノロジープレビューとして、Red Hat Enterprise Linux AI バージョン 1.2 を Microsoft Azure にインストールしてデプロイできるようになりました。Azure に Red Hat Enterprise Linux AI をインストールする方法の詳細は、Azure へのインストールを参照してください。

RHEL AI は現在、完全なエンドツーエンドのワークフローを実現するために、Azure インスタンス上の 8xA100 および 8xH100 アクセラレーターをサポートしています。Azure インスタンスでの推論用に、Red Hat が提供する LLM を提供することもできます。AWS の RHEL AI ハードウェア要件の詳細は、Red Hat Enterprise Linux AI ハードウェア要件を参照してください。Red Hat のテクノロジープレビュー機能のサポート範囲に関する詳細は、テクノロジープレビュー機能のサポート範囲を参照してください。

1.2.2. RHEL AI 環境の構築
リンクのコピー

Red Hat Enterprise Linux AI をインストールした後、InstructLab ツールを使用して RHEL AI 環境をセットアップできます。

1.2.2.1. InstructLab の初期化
リンクのコピー

ilab config init コマンドを実行して、RHEL AI 環境を初期化して設定できます。このコマンドは、RHEL AI と対話し、モデルを微調整するために必要な設定を作成します。また、データファイル用の適切なディレクトリーも作成します。

1.2.2.1.1. ハードウェア自動検出
リンクのコピー

Red Hat Enterprise Linux AI バージョン 1.2 では、InstructLab の初期化時にハードウェアの自動検出が提供されるようになりました。CLI は、自動検出によってハードウェアが正しく選択されたかどうかを確認するプロンプトを表示し、その後、トレーニングパラメーターを config.yaml ファイルに自動的に追加します。ハードウェアの自動検出の詳細は、InstructLab の初期化ドキュメントを参照してください。

1.2.2.2. 大規模言語モデルのダウンロード
リンクのコピー

Red Hat が提供するさまざまな大規模言語モデル (LLM) を RHEL AI マシンまたはインスタンスにダウンロードできます。Red Hat レジストリーアカウントを作成してログインすると、Red Hat レジストリーからこれらのモデルをダウンロードできます。サポートされている RHEL AI LLM の詳細は、モデルのダウンロードのドキュメントと「大規模言語モデル (LLM) のテクノロジープレビューステータス」を参照してください。

granite-8b-code-instruct および granite-8b-code-base コードモデルは、RHEL AI バージョン 1.2 で引き続きテクノロジープレビュー機能となっています。Red Hat のテクノロジープレビュー機能のサポート範囲に関する詳細は、テクノロジープレビュー機能のサポート範囲を参照してください。

1.2.2.3. モデルのサービング (提供) およびモデルとのチャット
リンクのコピー

Red Hat Enterprise Linux AI バージョン 1.2 では、さまざまな LLM 上で vLLM 推論サービングを実行できます。vLLM ツールは、LLM 用のメモリー効率の高い推論およびサービスエンジンライブラリーで、RHEL AI イメージに含まれています。モデルのサービングとモデルとのチャットの詳細は、モデルのサービング (提供) およびモデルとのチャットドキュメントを参照してください。

Red Hat Enterprise Linux AI では、さまざまなネットワークエンドポイントのカスタマイズを作成できます。モデルのサービング用の API エンドポイントの作成、推論サーバーとしてのマシンのセットアップ、その他のさまざまなオプションが含まれます。これらのカスタマイズの詳細は、モデルを使用したサービングとチャットのドキュメントを参照してください。

1.2.3. RHEL AI での大規模言語モデル (LLM) のカスタマイズ
リンクのコピー

Red Hat Enterprise Linux AI を使用すると、RHEL AI エンドツーエンドのワークフローを使用して granite-7b-starter ベースモデルをカスタマイズおよび微調整できます。

1.2.3.1. IBM Cloud でエンドツーエンドのワークフローを実行する
リンクのコピー

Red Hat Enterprise Linux AI バージョン 1.2 では、IBM Cloud を使用して Granite モデルをカスタマイズし、エンドツーエンドの InstructLab ワークフローを実行できるようになりました。IBM Cloud の RHEL AI エンドツーエンドのハードウェア要件の詳細は、Red Hat Enterprise Linux AI ハードウェア要件を参照してください。

1.2.3.2. Granite LLM にナレッジデータを追加します。
リンクのコピー

Red Hat Enterprise Linux AI で、モデルがドメイン固有の情報を学習できるように、タクソノミーツリーをカスタマイズできます。ナレッジデータを Git リポジトリーにホストし、そのデータを使用してモデルを微調整します。RHEL AI ワークフローでは、モデルが学習する質問と回答を含む qna.yaml ファイルを作成します。このファイルは、合成データ生成 (SDG) プロセス、トレーニング、評価を経て、Git リポジトリーと qna.yaml ファイルからのデータを含む新しい LLM を作成します。ナレッジマークダウンと YAML ファイルを作成する方法の詳細なドキュメントは、タクソノミーツリーへのナレッジの追加を参照してください。

1.2.3.3. 合成データ生成 (SDG)
リンクのコピー

Red Hat Enterprise Linux AI には、LAB で強化された合成データ生成 (SDG) メソッドが含まれています。独自のナレッジデータを含む qna.yaml ファイルを使用して、SDG プロセスで何百もの人工データセットを作成できます。SDG プロセスの実行の詳細は、合成データ生成 (SDG) による新しいデータセットの生成を参照してください。

1.2.3.4. データを使用したモデルのトレーニング
リンクのコピー

Red Hat Enterprise Linux AI には、LAB で強化されたマルチフェーズトレーニングメソッドが含まれています。これは、データセットを複数のフェーズでトレーニングおよび評価して、可能な限り最適なモデルを作成する微調整ストラテジーです。複数フェーズトレーニングの詳細は、モデルでのデータのトレーニングを参照してください。

1.2.3.4.1. Fully Sharded Data Parallels (FSDP) CPU オフロードによるトレーニング
リンクのコピー

Red Hat Enterprise Linux AI バージョン 1.2 では、PyTorch の Fully Sharded Data Parallels (FSDP) ツールがサポートされるようになりました。RHEL AI でのトレーニング実行中に FSDP を使用できるようになりました。

1.2.3.4.2. トレーニング実行の継続
リンクのコピー

Red Hat Enterprise Linux AI バージョン 1.2 では、マルチフェーズのトレーニング中に失敗した可能性のあるトレーニング実行を継続できるようになりました。以前のマルチフェーズトレーニング実行中に生成された YAML ファイルを指す、現在サポートされている --training-journal フラグを使用して ilab model train コマンドを実行することで、トレーニング実行を継続できます。これにより、すでに生成されたトレーニングデータが取得され、そのデータを使用してトレーニングが継続されます。トレーニングの継続に関する詳細は、トレーニング実行の継続を参照してください。

1.2.3.5. ベンチマーク評価
リンクのコピー

Red Hat Enterprise Linux AI には、新しくトレーニングされたモデルに対してベンチマーク評価を実行する機能が含まれています。トレーニング済みのモデルでは、MMLU_BRANCH ベンチマークを使用して追加したモデルをどの程度認識しているかを評価できます。ベンチマーク評価の詳細は、新しいモデルの評価を参照してください。

1.2. 新機能および機能拡張

1.2.1. インストール
リンクのコピー

1.2.1.1. AMD アクセラレーター搭載システムへの RHEL AI のインストール (テクノロジープレビュー)
リンクのコピー

1.2.1.2. Google Cloud Platform (GCP) への RHEL AI のインストール (テクノロジープレビュー)
リンクのコピー

1.2.1.3. Azure への RHEL AI のインストール (テクノロジープレビュー)
リンクのコピー

1.2.2. RHEL AI 環境の構築
リンクのコピー

1.2.2.1. InstructLab の初期化
リンクのコピー

1.2.2.1.1. ハードウェア自動検出
リンクのコピー

1.2.2.2. 大規模言語モデルのダウンロード
リンクのコピー

1.2.2.3. モデルのサービング (提供) およびモデルとのチャット
リンクのコピー

1.2.3. RHEL AI での大規模言語モデル (LLM) のカスタマイズ
リンクのコピー

1.2.3.1. IBM Cloud でエンドツーエンドのワークフローを実行する
リンクのコピー

1.2.3.2. Granite LLM にナレッジデータを追加します。
リンクのコピー

1.2.3.3. 合成データ生成 (SDG)
リンクのコピー

1.2.3.4. データを使用したモデルのトレーニング
リンクのコピー

1.2.3.4.1. Fully Sharded Data Parallels (FSDP) CPU オフロードによるトレーニング
リンクのコピー

1.2.3.4.2. トレーニング実行の継続
リンクのコピー

1.2.3.5. ベンチマーク評価
リンクのコピー

詳細情報

試用、購入および販売

コミュニティー

会社概要

多様性を受け入れるオープンソースの強化

Red Hat ドキュメントについて

Theme

Red Hat legal and privacy links

Red Hat legal and privacy links

1.2. 新機能および機能拡張

1.2.1. インストールリンクのコピーリンクがクリップボードにコピーされました!

1.2.1.1. AMD アクセラレーター搭載システムへの RHEL AI のインストール (テクノロジープレビュー)リンクのコピーリンクがクリップボードにコピーされました!

1.2.1.2. Google Cloud Platform (GCP) への RHEL AI のインストール (テクノロジープレビュー)リンクのコピーリンクがクリップボードにコピーされました!

1.2.1.3. Azure への RHEL AI のインストール (テクノロジープレビュー)リンクのコピーリンクがクリップボードにコピーされました!

1.2.2. RHEL AI 環境の構築リンクのコピーリンクがクリップボードにコピーされました!

1.2.2.1. InstructLab の初期化リンクのコピーリンクがクリップボードにコピーされました!

1.2.2.1.1. ハードウェア自動検出リンクのコピーリンクがクリップボードにコピーされました!

1.2.2.2. 大規模言語モデルのダウンロードリンクのコピーリンクがクリップボードにコピーされました!

1.2.2.3. モデルのサービング (提供) およびモデルとのチャットリンクのコピーリンクがクリップボードにコピーされました!

1.2.3. RHEL AI での大規模言語モデル (LLM) のカスタマイズリンクのコピーリンクがクリップボードにコピーされました!

1.2.3.1. IBM Cloud でエンドツーエンドのワークフローを実行するリンクのコピーリンクがクリップボードにコピーされました!

1.2.3.2. Granite LLM にナレッジデータを追加します。リンクのコピーリンクがクリップボードにコピーされました!

1.2.3.3. 合成データ生成 (SDG)リンクのコピーリンクがクリップボードにコピーされました!

1.2.3.4. データを使用したモデルのトレーニングリンクのコピーリンクがクリップボードにコピーされました!

1.2.3.4.1. Fully Sharded Data Parallels (FSDP) CPU オフロードによるトレーニングリンクのコピーリンクがクリップボードにコピーされました!

1.2.3.4.2. トレーニング実行の継続リンクのコピーリンクがクリップボードにコピーされました!

1.2.3.5. ベンチマーク評価リンクのコピーリンクがクリップボードにコピーされました!

詳細情報

試用、購入および販売

コミュニティー

会社概要

多様性を受け入れるオープンソースの強化

Red Hat ドキュメントについて

Theme

Red Hat legal and privacy links

Red Hat legal and privacy links

1.2.1. インストール
リンクのコピー

1.2.1.1. AMD アクセラレーター搭載システムへの RHEL AI のインストール (テクノロジープレビュー)
リンクのコピー

1.2.1.2. Google Cloud Platform (GCP) への RHEL AI のインストール (テクノロジープレビュー)
リンクのコピー

1.2.1.3. Azure への RHEL AI のインストール (テクノロジープレビュー)
リンクのコピー

1.2.2. RHEL AI 環境の構築
リンクのコピー

1.2.2.1. InstructLab の初期化
リンクのコピー

1.2.2.1.1. ハードウェア自動検出
リンクのコピー

1.2.2.2. 大規模言語モデルのダウンロード
リンクのコピー

1.2.2.3. モデルのサービング (提供) およびモデルとのチャット
リンクのコピー

1.2.3. RHEL AI での大規模言語モデル (LLM) のカスタマイズ
リンクのコピー

1.2.3.1. IBM Cloud でエンドツーエンドのワークフローを実行する
リンクのコピー

1.2.3.2. Granite LLM にナレッジデータを追加します。
リンクのコピー

1.2.3.3. 合成データ生成 (SDG)
リンクのコピー

1.2.3.4. データを使用したモデルのトレーニング
リンクのコピー

1.2.3.4.1. Fully Sharded Data Parallels (FSDP) CPU オフロードによるトレーニング
リンクのコピー

1.2.3.4.2. トレーニング実行の継続
リンクのコピー

1.2.3.5. ベンチマーク評価
リンクのコピー