HyperAIHyperAI

Command Palette

Search for a command to run...

Nemotron-Math-v2 수학적 추론 데이터셋

날짜

4달 전

조직

NVIDIA(英伟达)

Paper URL

2512.15489

라이선스

CC BY-SA 4.0

Nemotron-Math-v2는 NVIDIA Corporation에서 2025년에 공개한 수학적 추론 데이터셋입니다. 관련 연구 논문은 다음과 같습니다... Nemotron-Math: 다중 모드 지도 학습에서 수학적 추론의 효율적인 장기 컨텍스트 추출 주로 LLM(언어 기반 모델)이 구조화된 수학적 추론을 수행하도록 훈련시키고, 도구 활용 추론과 순수 언어 추론의 차이점을 연구하며, 장기적인 맥락 또는 다중 트랙 추론 시스템을 구축하는 데 사용됩니다. 이 데이터 세트는 약 347,000개의 고품질 수학 문제와 700만 개의 모델 생성 추론 궤적을 포함합니다. 각 문제는 추론 깊이의 높음/중간/낮음, 그리고 Python TIR 사용 여부에 따라 6가지 구성으로 해결되며, 결과는 LLM을 검증 도구로 사용하는 파이프라인을 통해 검증됩니다. 데이터 필드:

  • 문제: OpenMathReasoning 및 MathStackExchange와 같은 출처에서 발췌한 문제 설명입니다.
  • 메시지: LLM 교육에 사용되는 사용자와 어시스턴트 간의 대화 기록입니다.
  • expected_answer: 추출된 답변 또는 모델이 생성한 다수결 답변입니다.
  • 메타데이터: 다양한 추론 및 도구 사용 시나리오에서의 통과율
  • data_source: 데이터 소스는 AoPS 또는 StackExchange-Math입니다.
  • 도구: 사용된 도구 정의 또는 비어 있음.

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 코코딩, 즉시 사용 가능한 환경, 최적의 GPU 가격으로 AI 개발을 가속화하세요.

AI 협업 코딩
바로 사용 가능한 GPU
최적의 가격

HyperAI Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp
Nemotron-Math-v2 수학적 추론 데이터셋 | 데이터 세트 | HyperAI초신경