Command Palette

Search for a command to run...

PolyMath 数学推理数据集

日期

3 个月前

机构

上海交通大学

论文链接

arxiv.org

加入 Discord 社区

*该数据集支持在线使用,点击此处跳转

PolyMath 是由阿里巴巴和上海交通大学于 2025 年联合发布的一个数学推理数据集,相关论文成果为:「PolyMath: Evaluating Mathematical Reasoning in Multilingual Contexts」,旨在推动多数学推理方面的研究。

该数据集包含 500 道高质量的数学推理问题,且每个语言级别有 125 个问题。其使用了思维深度和知识广度 2 个核心维度,定义并划分数学难度,跨越 4 个级别,从 K-12 到奥林匹克竞赛和高等前沿数学。

数据集特点:

  • 语言多样性:PolyMath 中的每个问题都提供 18 种并行语言版本,涵盖全球 75% 以上的母语者及主要语言家族,确保高资源语言和低资源语言的多样性。
  • 高质量标注:每个问题翻译都由语言专家校准,避免直接使用 LLM 生成的输出,确保术语和逻辑的精确清晰。
数据集语种分布

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供