NuminaMath-CoT 数学竞赛问题数据集

日期

5 个月前

大小

1.01 GB

机构

AI-MO

发布地址

huggingface.co

许可协议

CC BY-NC-SA 3.0

* 该数据集支持在线使用,点击此处跳转

该数据集是 AI-MO 于 2024 年提出,包含 860k+ 数学竞赛问题-解答对,每个解答都使用了思维链 (Chain of Thought, CoT) 推理模板。数据集的来源包括中国高中数学练习题、美国和国际数学奥林匹克竞赛题。数据主要收集自在线试卷 PDF 和数学讨论论坛。处理步骤包括 (a) 从原始 PDF 进行 OCR,(b) 分割成问题-解决方案对,(c) 翻译成英文,(d) 重新调整以生成 CoT 推理格式,以及 (e) 最终答案格式。

NuminaMath-CoT.torrent

做种 1

下载中 0

已完成 31

总下载 85

  • NuminaMath-CoT/
    • README.md
      1.25 KB
    • README.txt
      2.5 KB
      • data/
        • NuminaMath-CoT.zip
          1.01 GB