NuminaMath-CoT 数学竞赛问题数据集
* 该数据集支持在线使用,点击此处跳转。
该数据集是 AI-MO 于 2024 年提出,包含 860k+ 数学竞赛问题-解答对,每个解答都使用了思维链 (Chain of Thought, CoT) 推理模板。数据集的来源包括中国高中数学练习题、美国和国际数学奥林匹克竞赛题。数据主要收集自在线试卷 PDF 和数学讨论论坛。处理步骤包括 (a) 从原始 PDF 进行 OCR,(b) 分割成问题-解决方案对,(c) 翻译成英文,(d) 重新调整以生成 CoT 推理格式,以及 (e) 最终答案格式。
NuminaMath-CoT.torrent
做种 1正在下载 0已完成 66总下载次数 181