*该数据集支持在线使用,点击此处跳转。
PolyMath 是由阿里巴巴和上海交通大学于 2025 年联合发布的一个数学推理数据集,相关论文成果为:「PolyMath: Evaluating Mathematical Reasoning in Multilingual Contexts」,旨在推动多数学推理方面的研究。
该数据集包含 500 道高质量的数学推理问题,且每个语言级别有 125 个问题。其使用了思维深度和知识广度 2 个核心维度,定义并划分数学难度,跨越 4 个级别,从 K-12 到奥林匹克竞赛和高等前沿数学。
数据集特点:
- 语言多样性:PolyMath 中的每个问题都提供 18 种并行语言版本,涵盖全球 75% 以上的母语者及主要语言家族,确保高资源语言和低资源语言的多样性。
- 高质量标注:每个问题翻译都由语言专家校准,避免直接使用 LLM 生成的输出,确保术语和逻辑的精确清晰。
