HyperAIHyperAI

Command Palette

Search for a command to run...

Nemotron-Math-v2 数学推理数据集

Date

2 天前

Organization

NVIDIA(英伟达)

License

CC BY-SA 4.0

Nemotron-Math-v2 是一个由 NVIDIA Corporation 于 2025 年发布的数学推理数据集,相关文论成果为 Nemotron-Math: Efficient Long-Context Distillation of Mathematical Reasoning from Multi-Mode Supervision 。主要用于训练 LLM 以执行结构化数学推理,研究工具增强的推理与纯语言推理的差异,以及构建长语境或多轨迹推理系统等。

该数据集包含约 34.7 万个高质量数学问题和 700 万个模型生成的推理轨迹。每个问题在六种配置下进行求解:高 / 中 / 低推理深度与是否使用 Python TIR,答案通过 LLM 作为裁判的管道进行验证。

数据字段:

  • problem: 从 OpenMathReasoning 和 Math StackExchange 等来源提取的问题陈述
  • messages: 用户和助手的对话记录,用于 LLM 训练
  • expected_answer: 提取的答案或模型生成的多数投票答案
  • metadata: 不同推理和工具使用情况下的通过率
  • data_source: 数据来源 AoPS 或 StackExchange-Math
  • tool: 使用的工具定义,或为空

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供