第4章 モデルのパフォーマンスの最適化のための YAML 作成プラクティス
タクソノミーツリーへのナレッジの追加 および タクソノミーツリーへのスキルの追加 で参照されるガイドラインは、スキルとナレッジ YAML ファイルの作成に関する標準手順を提供します。ただし、生成された合成データを最適化し、より高い品質モデルを作成するために、YAML ファイルを改善する方法もあります。
YAML ファイルの context フィールドにおける多様で包括的なコンテンツ
各 context ブロックには、ドキュメントのさまざまな情報と形式を含める必要があります。これにより、モデルは情報を提供するさまざまな方法を学ぶことができます。これらの情報を提供するさまざまな方法には、パラグラフ、さまざまな種類の表、リスト、手順、定義などがあります。
context ブロックは、ドキュメントの包括的な例である必要があります。context コンテンツと Q&A ペアの合計の長さは、750 トークンを超えることはできません。
効果的な質問の作成
質問は、モデルが回答できるような質問のタイプに合わせる必要があります。各質問は一意で、context フィールドの情報を参照する必要があります。完全な文章での質問を含めると、生成される合成データが向上し、モデルの回答品質が向上します。
効果的な回答の作成
回答は、質問に直接答え、モデルが提供できる回答のタイプを反映する必要があります。回答は完全な文章で、元の質問を参照する必要があります。完全な文章での回答を含めると、生成される合成データが向上し、モデルの回答品質が向上します。
回答は、context ブロックから直接コピーしないでください。直接コピーすると、モデルは推論するのではなく、抽出を学習する可能性があります。
質問に回答するための情報は、context ブロックにある必要があります。情報が別の context ブロックにあるか、参照されていない場合は、モデルがハルシネーションを起こす可能性があります。
高品質の質問と回答ペアの例
- question: How many eggs are needed to make roughly 24 chocolate chip cookies?
answer: You need around two eggs to make 24 chocolate chip cookies.
複数のドキュメントまたは複数の qna.yaml ファイルを使用する場合
複数のドキュメントが同様のサブジェクトまたはドメインに関連する場合は、qna.yaml ファイル 1 つを使用することが推奨されます。それぞれの qna.yaml ファイルには単数形のドキュメントタイプが含まれている必要がありますが、YAML ファイルでドキュメントタイプを混在させることはできません。
複数のドキュメントが関連していない場合は、個別の qna.yaml ファイルを使用することが推奨されます。
YAML ファイルへのリンクの追加
モデルはリンクを記憶できるため、YAML ファイルにリンクを追加できます。ただし、ハイパーリンクが頻繁に変更される場合は、ハイパーリンクを追加しないようにすることを推奨します。