HyperAI超神经

PolyMath 数学推理数据集

日期

7 days ago

机构

上海交通大学

发布地址

huggingface.co

下载帮助

*该数据集支持在线使用,点击此处跳转

PolyMath 是由阿里巴巴和上海交通大学于 2025 年联合发布的一个数学推理数据集,相关论文成果为:「PolyMath: Evaluating Mathematical Reasoning in Multilingual Contexts」,旨在推动多数学推理方面的研究。

该数据集包含 500 道高质量的数学推理问题,且每个语言级别有 125 个问题。其使用了思维深度和知识广度 2 个核心维度,定义并划分数学难度,跨越 4 个级别,从 K-12 到奥林匹克竞赛和高等前沿数学。

数据集特点:

  • 语言多样性:PolyMath 中的每个问题都提供 18 种并行语言版本,涵盖全球 75% 以上的母语者及主要语言家族,确保高资源语言和低资源语言的多样性。
  • 高质量标注:每个问题翻译都由语言专家校准,避免直接使用 LLM 生成的输出,确保术语和逻辑的精确清晰。
数据集语种分布