OpenMathReasoning 数学的推論データセット
OpenMathReasoning データセットは、2025 年に NVIDIA がリリースした、数学的推論に焦点を当てた世界初の大規模で高品質なデータセットです。関連する論文結果は次のとおりです。AIMO-2 受賞ソリューション: OpenMathReasoning データセットを用いた最先端の数学的推論モデルの構築「」は、OpenMath-Nemotron シリーズのモデルが数学的推論の分野で優れた成果を達成できるようにすることを目指しています。
データセットには、数学の問題の種類のラベル、詳細な問題解決手順、問題の難易度レベルの分類など、多次元の詳細な注釈が含まれています。数学の専門分野とオンラインコミュニティから得られるこれらの高品質のデータは、数学的推論プロセスと数学の問題解決モデルの最適化に関する詳細な研究に強力かつ確固としたサポートを提供し、インテリジェントな数学指導システム、数学競技補助ツール、科学研究コンピューティング自動化などの関連産業の活発な発展を促進します。
このデータセットには以下が含まれます。
- AoPSフォーラムからの54万件のユニークな数学の問題、
- 320万長期信頼戦略(CoT)ソリューション
- 1.7M長のツール統合推論(TIR)ソリューション
- 多数の候補から最も有望なソリューションを選択するための 566K サンプル (GenSelect)