AceMath Instruct Training Data 수학적 추론 데이터 세트
AceMath Instruct Training Data는 NVIDIA가 2025년에 AceMath 모델을 훈련하기 위해 출시한 데이터 세트로, 수학적 추론 과제에서 모델의 성능을 개선하는 것을 목표로 합니다. 관련 논문 결과는 "AceMath: 사후 훈련 및 보상 모델링을 통한 프런티어 수학 추론 발전".
이 데이터 세트에는 여러 단계의 미세 조정 데이터가 포함되어 있습니다. general_sft_stage1
코드와 수학 분야의 명령어 미세 조정 샘플을 주로 다루는 2,261,687개의 샘플을 포함합니다. general_sft_stage2
1,634,573개의 샘플을 포함하고 있으며, 코드, 수학, 일반 도메인 지침 미세 조정까지 확장되었습니다. 특히 수학 도메인에 대해서 math_sft
이 테스트에는 1,661,094개의 샘플이 포함되어 있으며, 수학적 추론 능력을 향상시키는 데 중점을 두고 있습니다. 이러한 데이터는 Qwen2.5-Math-72B-Instruct와 GPT-4o-mini 모델을 결합하여 데이터의 다양성과 높은 품질을 보장합니다.
AceMath-Instruct-Training-Data.torrent
시딩 1다운로드 중 1완료됨 29총 다운로드 횟수 36