HyperAI초신경

Orca-Math-200K Microsoft 수학 단어 문제 데이터 세트

날짜

일 년 전

크기

70.88 MB

기관

마이크로소프트

발행 주소

huggingface.co

Orca-Math-200K는 Microsoft에서 만든 고품질 합성 데이터 세트로, 약 20만 개의 초등학교 수학 문제가 포함되어 있습니다. 이 데이터 세트의 모든 답변은 Azure GPT4-Turbo를 사용하여 생성되었습니다.

연구자들은 데이터 세트 구축을 돕기 위해 여러 에이전트를 만들었습니다. 생성 과정에는 시드 세트 구성, 에이전트-Ask Me Anything 질문 생성, 에이전트-제안자-편집자 협업 생성, DMath 데이터 세트 가져오기, 데이터 세트 향상 및 반복 학습 프로세스가 포함되었습니다. 이 데이터 세트는 언어 모델의 수학적 능력을 향상시켜 수학 문제를 해결하는 데 있어 언어 모델의 견고한 기반을 제공하는 것을 목표로 합니다.

orca-math-word.torrent
시딩 1다운로드 중 1완료됨 122총 다운로드 횟수 226
  • orca-math-word/
    • README.md
      1.34 KB
    • README.txt
      2.68 KB
      • data/
        • orca-math-word-200k.zip
          70.88 MB