HyperAI超神经

OpenR1-Math-220k 数学推理数据集

日期

2 个月前

大小

3.51 GB

机构

发布地址

huggingface.co

许可协议

Apache 2.0

OpenR1-Math-220k 是一个大规模的数学推理数据集,由 Open R1 团队于 2025 年发布,旨在填补 DeepSeek R1 合成数据的缺口。该数据集包含 22 万条高质量的数学问题及其推理轨迹,这些数据源自 80 万条由 DeepSeek R1 生成的推理轨迹。

数据集分为两个部分:

  • default(94k 问题):这部分数据在经过监督微调 (SFT) 后表现最佳。
  • extended(131k 问题):这部分数据包含额外的 NuminaMath 1.5 数据源,例如 cn_k12,提供了更多的推理公式。
OpenR1-Math-220k.torrent
做种 0正在下载 1已完成 29总下载次数 57
  • OpenR1-Math-220k/
    • README.md
      1.29 KB
    • README.txt
      2.58 KB
      • data/
        • OpenR1-Math-220k.zip
          3.51 GB