Big-Math 强化学习数学数据集
* 该数据集支持在线使用,点击此处跳转。
Big-Math 是一个大规模、高质量的数学数据集,专为强化学习 (Reinforcement Learning, RL) 在语言模型中的应用而设计。该数据集由斯坦福大学和 SynthLabs 的研究人员于 2025 年发布,相关论文成果为「Big-Math: A Large-Scale, High-Quality Math Dataset for Reinforcement Learning in Language Models」。
数据集特点
Big-Math 包含超过 250k 个高质量数学问题,每个问题都配有可验证的答案。数据集中的问题满足 3 个关键标准:
- 唯一可验证的解决方案:每个问题都有唯一的正确答案。
- 封闭形式的解:问题有明确的解法每个问题都配有可验证的答案。
- 开放式问题:问题表述开放,允许多种解题方法。

Big-Math-RL-Verified.torrent
做种 1正在下载 1已完成 22总下载次数 48