Nemotron-Math-HumanReasoning 수학적 추론 데이터 세트
Nemotron-Math-HumanReasoning은 NVIDIA가 2025년에 발표한 수학적 추론 데이터 세트입니다. 관련 논문 결과는 다음과 같습니다.RL 또는 Distillation 없이 LLM에 추론을 가르치는 과제"는 DeepSeek-R1과 같은 모델의 확장된 추론 스타일을 시뮬레이션하는 것을 목표로 합니다.
이 데이터 세트에는 OpenMathReasoning 데이터 세트의 수학 문제 50개, 사람이 작성한 솔루션 200개, QwQ-32B-Preview에서 생성한 추가 솔루션 50개가 포함되어 있습니다.
데이터에는 다음이 포함됩니다.
- 수학 문제 설명
- 문제를 해결하는 방법
- 문제 해결 유형
- 질문에 대한 실제 답변
Nemotron-Math-HumanReasoning.torrent
시딩 1다운로드 중 0완료됨 5총 다운로드 횟수 8