HyperAIHyperAI

Command Palette

Search for a command to run...

Big-Math 强化学习数学数据集

Date

10 个月前

Size

27.41 MB

Publish URL

github.com

Paper URL

arxiv.org

Big-Math 是一个大规模、高质量的数学数据集,专为强化学习 (Reinforcement Learning, RL) 在语言模型中的应用而设计。该数据集由斯坦福大学和 SynthLabs 的研究人员于 2025 年发布,相关论文成果为「Big-Math: A Large-Scale, High-Quality Math Dataset for Reinforcement Learning in Language Models」。

数据集特点

Big-Math 包含超过 250k 个高质量数学问题,每个问题都配有可验证的答案。数据集中的问题满足 3 个关键标准:

  • 唯一可验证的解决方案:每个问题都有唯一的正确答案。
  • 封闭形式的解:问题有明确的解法每个问题都配有可验证的答案。
  • 开放式问题:问题表述开放,允许多种解题方法。
使用 Llama-3.1-8B 计算的按域划分的求解率分布
Big-Math-RL-Verified.torrent
Seeding 1Downloading 0Completed 173Total Downloads 361
  • Big-Math-RL-Verified/
    • README.md
      1.58 KB
    • README.txt
      3.17 KB
      • data/
        • bigmath.zip
          27.41 MB

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供