このデータセットは 2024 年に AI-MO によって提案され、86 万以上の数学コンテストの質問と回答のペアが含まれており、各回答には思考連鎖 (CoT) 推論テンプレートが使用されています。データセットのソースには、中国の高校数学の練習問題、アメリカおよび国際数学オリンピックの問題が含まれます。データは主にオンラインの試験問題 PDF と数学ディスカッション フォーラムから収集されました。処理ステップには、(a) 生の PDF からの OCR、(b) 質問と解決策のペアへの分割、(c) 英語への翻訳、(d) CoT 推論形式を生成するための再構成、および (e) 最終回答形式が含まれます。
做种 2
下载中 0
已完成 31
总下载 85