*このデータセットはオンラインでの使用をサポートしています。ここをクリックしてジャンプしてください。
PolyMathは、アリババと上海交通大学が2025年に共同でリリースした数学的推論データセットです。関連する論文結果は次のとおりです。PolyMath: 多言語環境における数学的推論の評価数学的推論の研究を促進することを目的としています。
このデータセットには、500問の高品質な数学的推論問題が含まれており、各言語レベルに125問ずつ用意されています。思考の深さと知識の広さという2つの中核的な尺度を用いて、幼稚園から高校までの数学レベルからオリンピック競技、そして最先端の数学レベルまで、4つのレベルにわたって数学の難易度を定義・分類しています。
データセットの機能:
- 言語の多様性: PolyMath のすべての問題は 18 の並行言語で提供されており、世界中の 75% 以上のネイティブ スピーカーと主要言語ファミリーをカバーし、リソースの多い言語とリソースの少ない言語の両方で多様性を確保しています。
- 高品質の注釈: 各質問の翻訳は言語学者によって調整され、LLM によって生成された出力を直接使用せずに、正確で明確な用語とロジックを保証します。
