MathX-5M 수학적 추론 데이터 세트
MathX는 사고 능력을 향상시키기 위해 명령어 기반 모델 튜닝 및 기존 모델의 미세 조정을 위해 설계된 수학적 추론 데이터셋입니다. 이 데이터셋은 현재까지 공개된 수학적 추론 데이터 중 가장 방대하고 포괄적인 코퍼스입니다.
이 데이터 세트에는 신중하게 선택된 500만 개의 단계별 사고 데이터 예시가 포함되어 있으며, 각 예시에는 문제 설명, 상세한 추론 과정, 검증된 정답이 포함됩니다. 예시에는 산술 및 정수론, 대수 및 다항식 수학, 기하학 및 삼각법, 미적분 및 해석학이 포함됩니다.
문제 복잡도 분포
- 기초 수준(30%): 기본적인 수학 개념 및 연산
- 중급(30%): 추론 체인이 필요한 다단계 문제
- 고급(40%): 복잡한 수학적 과제와 증명
데이터 세트 기능:
- 다양성: 기본 산수부터 고급 미적분까지 수학의 포괄적인 범위
- 품질: 다단계 선별 및 검증 프로세스
- 추론: 자세한 수학적 아이디어를 담은 단계별 솔루션
- 정확도: 강화 학습을 통해 검증되고 정확성이 검증된 답변