HyperAI초신경

AceReason-1.1-SFT 수학 코드 추론 데이터 세트

날짜

5일 전

기관

엔비디아

발행 주소

huggingface.co

카테고리

다운로드 도움말

AceReason-1.1-SFT는 NVIDIA가 2025년에 출시한 다양하고 고품질의 지도 미세 조정(SFT) 데이터셋으로, 수학적 추론 및 코드 추론에 중점을 두고 있습니다. 관련 논문 결과는 다음과 같습니다.AceReason-Nemotron 1.1: SFT와 RL 시너지를 통한 수학 및 코드 추론 발전"는 수학적 추론과 코드 추론에 초점을 맞춘 SFT 모델을 훈련하는 것을 목표로 합니다.

이 데이터 세트는 수학적 및 코드 추론 모델로 사용됩니다. 에이스리즌-네모트론-1.1-7B SFT 학습 데이터의 경우, 데이터 세트의 모든 답변은 DeepSeek-R1을 통해 생성되었습니다.

AceReason-1.1-SFT 데이터셋은 OpenMathReasoning, NuminaMath-CoT, OpenCodeReasoning, MagicoderEvolInstruct, opc-sft-stage2, leetcode, TACO 및 앱의 데이터를 포함하여 2,668,741개의 수학 샘플과 1,301,591개의 코드 샘플을 포함합니다. 데이터셋은 정제되었으며, 수학 및 코딩 벤치마크의 테스트 샘플과 9-gram이 중복되는 샘플은 필터링되었습니다.