1.2. InstructLab および RHEL AI
InstructLab は、大規模言語モデルへの貢献を促進するオープンソース AI プロジェクトです。RHEL AI は、InstructLab プロジェクトの基盤を採用し、アプリケーション上の LLM 統合のためのエンタープライズプラットフォームを構築します。Red Hat Enterprise Linux AI は、専用のグラフィックプロセッシングユニット (GPU) を備えた高性能サーバープラットフォームを対象としています。InstructLab は、ラップトップやパーソナルコンピューターなどの小規模プラットフォームを対象としています。
InstructLab は、LAB (Large-scale Alignment for chatBots) 手法を実装しています。この手法は、合成データに基づく LLM 向けの新しいファインチューニング方法です。LAB プロセスは、いくつかのコンポーネントで構成されています。
- 分類に基づいた合成データ生成プロセス
- 複数フェーズのトレーニングプロセス
- ファインチューニングフレームワーク
RHEL AI と InstructLab を使用すると、独自のユースケースに合わせてドメイン固有のナレッジを使用して LLM をカスタマイズできます。
1.2.1. スキルとナレッジの概要 リンクのコピーリンクがクリップボードにコピーされました!
スキルとナレッジは、タクソノミーツリーに追加できるデータの種類です。上記のタイプを使用して、独自のデータでファインチューニングされたカスタム LLM モデルを作成できます。
1.2.1.1. ナレッジ リンクのコピーリンクがクリップボードにコピーされました!
AI モデルのナレッジは、データとファクトで構成されています。モデルのナレッジセットを作成するときは、モデルが質問にさらに正確に回答できるように、追加のデータと情報を提供します。スキルとは、AI モデルが何かを行う方法を学習するための情報です。一方で、ナレッジは、ファクト、データ、またはリファレンスを基にした質問に答えるモデルの能力に基づいています。たとえば、製品のドキュメントを含むデータセットを作成し、モデルがそのドキュメントで提供される情報を学習できます。
1.2.1.2. スキル リンクのコピーリンクがクリップボードにコピーされました!
スキルとは、送信された情報に基づいて AI モデルをトレーニングすることを目的とした機能ドメインです。スキルを作成するときは、モデルにタスクの実行方法を教えます。RHEL AI のスキルは、次のカテゴリーに分類されます。
構成スキル: 構成スキルにより、AI モデルは特定のタスクや機能を実行できます。構成スキルには、以下の 2 つのタイプがあります。
- 自由形式の構成スキル: 機能するために追加のコンテキストや情報を必要としないパフォーマンススキルです。
- グラウンディング構成スキル: このスキルは追加のコンテキストを必要とする実行スキルです。たとえば、モデルが表を読み取れるように訓練できます。この場合、追加のコンテキストは表のレイアウトの例などです。
- 基礎スキル: 基礎スキルとは、数学、推論、コーディングに関わるスキルです。