Command Palette

Search for a command to run...

AceReason-1.1-SFT 수학 코드 추론 데이터 세트

날짜

4달 전

기관

엔비디아

논문 URL

arxiv.org

Discord 커뮤니티 참여

AceReason-1.1-SFT는 NVIDIA가 2025년에 출시한 다양하고 고품질의 지도 미세 조정(SFT) 데이터셋으로, 수학적 추론 및 코드 추론에 중점을 두고 있습니다. 관련 논문 결과는 다음과 같습니다.AceReason-Nemotron 1.1: SFT와 RL 시너지를 통한 수학 및 코드 추론 발전"는 수학적 추론과 코드 추론에 초점을 맞춘 SFT 모델을 훈련하는 것을 목표로 합니다.

이 데이터 세트는 수학적 및 코드 추론 모델로 사용됩니다. 에이스리즌-네모트론-1.1-7B SFT 학습 데이터의 경우, 데이터 세트의 모든 답변은 DeepSeek-R1을 통해 생성되었습니다.

AceReason-1.1-SFT 데이터셋은 OpenMathReasoning, NuminaMath-CoT, OpenCodeReasoning, MagicoderEvolInstruct, opc-sft-stage2, leetcode, TACO 및 앱의 데이터를 포함하여 2,668,741개의 수학 샘플과 1,301,591개의 코드 샘플을 포함합니다. 데이터셋은 정제되었으며, 수학 및 코딩 벤치마크의 테스트 샘플과 9-gram이 중복되는 샘플은 필터링되었습니다.

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 공동 코딩, 즉시 사용 가능한 환경, 최적 가격 GPU로 AI 개발을 가속화하세요.

AI 공동 코딩
즉시 사용 가능한 GPU
최적 가격
시작하기

Hyper Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp
AceReason-1.1-SFT 수학 코드 추론 데이터 세트 | 데이터셋 | HyperAI초신경