HyperAIHyperAI

Command Palette

Search for a command to run...

PolyMath 数学推理数据集

Use this DatasetDiscuss on Discord

Date

5 个月前

Organization

上海交通大学

Paper URL

arxiv.org

PolyMath 是由阿里巴巴和上海交通大学于 2025 年联合发布的一个数学推理数据集,相关论文成果为:「PolyMath: Evaluating Mathematical Reasoning in Multilingual Contexts」,旨在推动多数学推理方面的研究。

该数据集包含 500 道高质量的数学推理问题,且每个语言级别有 125 个问题。其使用了思维深度和知识广度 2 个核心维度,定义并划分数学难度,跨越 4 个级别,从 K-12 到奥林匹克竞赛和高等前沿数学。

数据集特点:

  • 语言多样性:PolyMath 中的每个问题都提供 18 种并行语言版本,涵盖全球 75% 以上的母语者及主要语言家族,确保高资源语言和低资源语言的多样性。
  • 高质量标注:每个问题翻译都由语言专家校准,避免直接使用 LLM 生成的输出,确保术语和逻辑的精确清晰。
数据集语种分布

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供