Nemotron-Math-HumanReasoning 数学的推論データセット
Nemotron-Math-HumanReasoningは、NVIDIAが2025年にリリースした数学的推論データセットです。関連する論文の結果は「強化学習や蒸留なしで法学修士課程の学生に推論を教える課題「DeepSeek-R1 などのモデルの拡張推論スタイルをシミュレートすることを目的としています。
このデータセットには、OpenMathReasoning データセットからの 50 個の数学の問題、人間が作成した 200 個の解答、および QwQ-32B-Preview によって生成された追加の 50 個の解答が含まれています。
データには以下が含まれます:
- 数学の問題の説明
- 問題を解決する方法
- 問題解決の種類
- 質問に対する本当の答え
Nemotron-Math-HumanReasoning.torrent
シーディング 1ダウンロード中 0ダウンロード完了 5総ダウンロード数 8