HyperAI초신경

GOAT 산술 작업 미세 조정 데이터 세트

날짜

4달 전

크기

89.46 MB

기관

싱가포르 국립대학교

발행 주소

github.com

이 데이터 세트는 싱가포르 국립대학 연구자들에 의해 2023년에 공개되었습니다.염소: 미세 조정된 LLaMA, 산술 작업에서 GPT-4보다 우수한 성능 발휘". 데이터세트에는 dataset.json과 dataset.ipynb라는 두 개의 파일이 있습니다. dataset.json 파일에는 dataset.ipynb에서 생성된 산술 연산을 위한 약 170만 개의 합성 데이터가 포함되어 있습니다.

데이터 세트의 각 인스턴스에는 다음이 포함됩니다.

  • 지침: 인간이 만든 명령어로, 무작위로 선택한 템플릿에 산술 표현식을 삽입하고 자연스러운 언어 노이즈를 추가하여 형성됩니다. 이는 프롬프트 역할을 하며 모델의 지침을 미세하게 조정하는 데 사용됩니다.
  • 입력하다: 무작위로 생성된 산술 표현식입니다. 자연어의 영향을 피하고 산술에 집중하고 싶을 때 훈련을 위한 "지침"을 대체하는 데 사용할 수 있습니다.
  • 산출: 모델 학습의 목표 출력. 여기에는 여러 자리 곱셈과 나눗셈을 위한 Chained Thoughts(CoTs)가 포함되어 있습니다.
  • 답변: 산수 문제에 대한 직접적인 숫자 답변. 다양한 하위 과제의 학습 능력을 테스트하는 데 사용할 수 있습니다.
goat.torrent
시딩 1다운로드 중 1완료됨 43총 다운로드 횟수 22
  • goat/
    • README.md
      1.68 KB
    • README.txt
      3.35 KB
      • data/
        • goat.zip
          89.46 MB