4장. 모델 성능을 최적화하기 위한 YAML 생성 사례
taxonomy tree 및 taxonomy 트리에 기술 추가 기술 추가에서 참조된 지침은 기술 및 지식 YAML 파일을 생성하는 데 대한 표준 지침을 제공합니다. 그러나 YAML 파일을 개선하여 생성된 syndetic 데이터를 최적화하고 더 높은 품질 모델을 생성할 수 있는 방법이 있습니다.
YAML 파일의 컨텍스트 필드에 있는 다양하고 포괄적인 콘텐츠
각 컨텍스트 블록에는 문서의 다양한 정보와 형식 유형이 포함되어야 합니다. 이를 통해 모델은 다양한 정보를 제공하는 방법을 배울 수 있습니다. 이러한 다양한 정보 프레젠테이션 유형에는 단락, 유형 테이블, 목록, 프로시저 및 정의가 포함될 수 있습니다.
컨텍스트 블록은 문서의 포괄적인 예여야 합니다. 컨텍스트 콘텐츠 및 Q&A 쌍의 총 길이는 750 토큰을 초과해서는 안 됩니다.
효과적인 질문 작성
질문은 모델이 답변할 수 있도록 원하는 질문 유형과 일치해야 합니다. 각 질문은 고유해야 하며 컨텍스트 필드의 정보를 참조해야 합니다. 전체 문장 질문을 포함하면 생성된 합성 데이터가 개선되고 모델 응답 품질이 향상됩니다.
효과적인 답변 작성
답변은 질문에 직접 응답하고 모델이 제공할 수 있는 응답 유형을 반영해야 합니다. 답변은 완전한 문장으로 되어 있어야 하며 원본 질문을 참조합니다. 전체 문장 응답을 포함하면 생성된 합성 데이터가 향상되고 모델 응답 품질이 향상됩니다.
답변은 컨텍스트 블록에서 직접 복사해서는 안되며, 이로 인해 모델이 추론 대신 추출을 배울 수 있습니다.
질문에 답변할 정보는 context 블록에 있어야 합니다. 정보가 별도의 컨텍스트 블록에 있거나 전혀 참조되지 않은 경우 모델을 사용할 수 있습니다.
수준 높은 질문 및 응답 쌍의 예
- question: How many eggs are needed to make roughly 24 chocolate chip cookies? answer: You need around two eggs to make 24 chocolate chip cookies.
- question: How many eggs are needed to make roughly 24 chocolate chip cookies?
answer: You need around two eggs to make 24 chocolate chip cookies.
여러 문서 또는 여러 qna.yaml 파일을 사용하는 경우
여러 문서가 유사한 제목 또는 도메인과 관련된 경우 단일 qna.yaml 파일을 사용하는 것이 좋습니다. 각 qna.yaml 파일에는 단일 문서 유형이 포함되어야 하며 YAML 파일에서 문서 유형을 혼합할 수 없습니다.
문서가 관련이 없는 경우 별도의 qna.yaml 파일을 사용하는 것이 좋습니다.
YAML 파일에 링크 추가
모델은 링크를 암기할 수 있으므로 YAML 파일에 추가할 수 있습니다. 그러나 자주 변경되는 경우 하이퍼링크를 추가하지 않는 것이 좋습니다.