该数据集是 AI-MO 于 2024 年提出,包含 860k+ 数学竞赛问题-解答对,每个解答都使用了思维链 (Chain of Thought, CoT) 推理模板。数据集的来源包括中国高中数学练习题、美国和国际数学奥林匹克竞赛题。数据主要收集自在线试卷 PDF 和数学讨论论坛。处理步骤包括 (a) 从原始 PDF 进行 OCR,(b) 分割成问题-解决方案对,(c) 翻译成英文,(d) 重新调整以生成 CoT 推理格式,以及 (e) 最终答案格式。
做种 1
下载中 0
已完成 31
总下载 85