HyperAI초신경

AceMath Instruct Training Data 수학적 추론 데이터 세트

날짜

4달 전

크기

4.82 GB

기관

엔비디아

발행 주소

huggingface.co

AceMath Instruct Training Data는 NVIDIA가 2025년에 AceMath 모델을 훈련하기 위해 출시한 데이터 세트로, 수학적 추론 과제에서 모델의 성능을 개선하는 것을 목표로 합니다. 관련 논문 결과는 "AceMath: 사후 훈련 및 보상 모델링을 통한 프런티어 수학 추론 발전".

이 데이터 세트에는 여러 단계의 미세 조정 데이터가 포함되어 있습니다. general_sft_stage1 코드와 수학 분야의 명령어 미세 조정 샘플을 주로 다루는 2,261,687개의 샘플을 포함합니다. general_sft_stage2 1,634,573개의 샘플을 포함하고 있으며, 코드, 수학, 일반 도메인 지침 미세 조정까지 확장되었습니다. 특히 수학 도메인에 대해서 math_sft 이 테스트에는 1,661,094개의 샘플이 포함되어 있으며, 수학적 추론 능력을 향상시키는 데 중점을 두고 있습니다. 이러한 데이터는 Qwen2.5-Math-72B-Instruct와 GPT-4o-mini 모델을 결합하여 데이터의 다양성과 높은 품질을 보장합니다.

AceMath-Instruct-Training-Data.torrent
시딩 1다운로드 중 1완료됨 29총 다운로드 횟수 36
  • AceMath-Instruct-Training-Data/
    • README.md
      1.61 KB
    • README.txt
      3.23 KB
      • data/
        • AceMath-Instruct-Training-Data.zip
          4.82 GB