第 4 章 优化模型性能的 YAML 创建实践
在为您的税务树 添加知识和为您的税务树 添加技能时所 参考的指南提供了创建知识和知识 YAML 文件的标准说明。但是,您可以通过多种方式改进 YAML 文件,以优化生成的复合数据并创建更高质量的模型。
YAML 文件的 context 字段中有不同和全面的内容
每个 上下文 块都包含文档中的各种信息和格式类型。这允许模型了解显示信息的不同方法。这些不同的信息表示类型包括:段落、不同类型的表、列表、程序和定义。
context 块应该是您的文档中的一个全面的示例。上下文 内容的总长度和 Q&A 对不应超过 750 令牌。
编写有效问题
问题应该与您希望模型可以回答的问题类型一致。每个问题都应该是唯一的,并在 上下文 字段中引用信息。包括完整句子问题可改进生成的复合数据,并改进模型响应质量。
编写有效答案
回答直接回答问题,并应反映您希望模型能够提供的回答类型。回答应处于完全句子,并参考原始问题。包括完整句子答案可提高生成的复合数据,并改进模型响应质量。
不应直接从 上下文 块直接复制答案,这可能导致模型学习提取而不是原因。
回答问题的信息必须在 上下文 块中。如果信息位于单独的上下文块中,或者根本没有引用,则模型可能会妨碍。
高质量问答对示例
- question: How many eggs are needed to make roughly 24 chocolate chip cookies?
answer: You need around two eggs to make 24 chocolate chip cookies.
何时使用多个文档或多个 qna.yaml 文件
如果多个文档与类似的主题或域相关,建议使用单个 qna.yaml 文件。每个 qna.yaml 文件必须包含 singular 文档类型,您不能在 YAML 文件中混合使用文档类型。
如果文档不相关,建议使用单独的 qna.yaml 文件。
在 YAML 文件中添加链接
模型可以记住链接,因此可以将它们添加到 YAML 文件中。但是,建议避免在频繁变化时添加超链接。