Command Palette
Search for a command to run...
Nemotron-Math-v2 数学推論データセット
Nemotron-Math-v2 は、NVIDIA Corporation が 2025 年にリリースした数学推論データセットです。関連する研究論文には以下が含まれます... Nemotron-Math: マルチモード監視からの数学的推論の効率的なロングコンテキスト抽出 これは主に、LLM が構造化された数学的推論を実行できるようにトレーニングするため、ツール強化推論と純粋言語推論の違いを研究するため、および長期コンテキストまたはマルチトラック推論システムを構築するために使用されます。
このデータセットには、約347,000件の高品質な数学問題と、モデルによって生成された700万件の推論軌跡が含まれています。各問題は、推論深度が高/中/低、Python TIRの有無の6つの構成で解かれ、LLMをアービターとして用いたパイプラインによって検証されます。
データフィールド:
- 問題: OpenMathReasoning や MathStackExchange などのソースから抽出された問題ステートメント。
- メッセージ: LLM トレーニングに使用される、ユーザーとアシスタントの会話ログ。
- expected_answer: 抽出された回答、またはモデルによって生成された多数決の回答。
- メタデータ: さまざまな推論とツールの使用シナリオにおける合格率
- data_source: データソースはAoPSまたはStackExchange-Mathです
- tool: 使用されるツール定義、または空。
Build AI with AI
From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.