MathX-5M 수학적 추론 데이터 세트

날짜

2달 전

발행 주소

huggingface.co

라이선스

MIT

카테고리

다운로드 도움말

MathX는 사고 능력을 향상시키기 위해 명령어 기반 모델 튜닝 및 기존 모델의 미세 조정을 위해 설계된 수학적 추론 데이터셋입니다. 이 데이터셋은 현재까지 공개된 수학적 추론 데이터 중 가장 방대하고 포괄적인 코퍼스입니다.

이 데이터 세트에는 신중하게 선택된 500만 개의 단계별 사고 데이터 예시가 포함되어 있으며, 각 예시에는 문제 설명, 상세한 추론 과정, 검증된 정답이 포함됩니다. 예시에는 산술 및 정수론, 대수 및 다항식 수학, 기하학 및 삼각법, 미적분 및 해석학이 포함됩니다.

문제 복잡도 분포

  • 기초 수준(30%): 기본적인 수학 개념 및 연산
  • 중급(30%): 추론 체인이 필요한 다단계 문제
  • 고급(40%): 복잡한 수학적 과제와 증명

데이터 세트 기능:

  • 다양성: 기본 산수부터 고급 미적분까지 수학의 포괄적인 범위
  • 품질: 다단계 선별 및 검증 프로세스
  • 추론: 자세한 수학적 아이디어를 담은 단계별 솔루션
  • 정확도: 강화 학습을 통해 검증되고 정확성이 검증된 답변
MathX-5M 수학적 추론 데이터 세트 | 데이터셋 | HyperAI초신경