Command Palette
Search for a command to run...
Nemotron-Math-v2 数学推理数据集
Nemotron-Math-v2 是一个由 NVIDIA Corporation 于 2025 年发布的数学推理数据集,相关文论成果为 Nemotron-Math: Efficient Long-Context Distillation of Mathematical Reasoning from Multi-Mode Supervision 。主要用于训练 LLM 以执行结构化数学推理,研究工具增强的推理与纯语言推理的差异,以及构建长语境或多轨迹推理系统等。
该数据集包含约 34.7 万个高质量数学问题和 700 万个模型生成的推理轨迹。每个问题在六种配置下进行求解:高 / 中 / 低推理深度与是否使用 Python TIR,答案通过 LLM 作为裁判的管道进行验证。
数据字段:
- problem: 从 OpenMathReasoning 和 Math StackExchange 等来源提取的问题陈述
- messages: 用户和助手的对话记录,用于 LLM 训练
- expected_answer: 提取的答案或模型生成的多数投票答案
- metadata: 不同推理和工具使用情况下的通过率
- data_source: 数据来源 AoPS 或 StackExchange-Math
- tool: 使用的工具定义,或为空
Build AI with AI
From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.