HyperAIHyperAI

Command Palette

Search for a command to run...

HLE 人类问题推理基准数据集

Date

7 个月前

Size

227.35 MB

Paper URL

arxiv.org

HLE 全称为 Humanity’s Last Exam,是由人工智能安全中心(Center for AI Safety)与 Scale AI 于 2025 年 联合发布的一个多模态人类问题基准数据集,相关论文成果为:「Humanity’s Last Exam」,旨在构建覆盖人类知识前沿的终极封闭式评估体系。

该数据集包含 2,500 道题目,覆盖数学、人文科学、自然科学等数十个学科,其中包含适合自动评分的选择题和简答题。

学科分布:

  • 数学(41%):高等数学、概率论、算法设计等抽象问题。
  • 计算机科学 / 人工智能(10%):机器学习理论、计算复杂性、自然语言处理。
  • 自然科学(27%):物理(9%)、化学(7%)、生物 / 医学(11%),涉及量子物理、有机合成、病理机制等。
  • 人文 / 社会科学(9%):哲学、历史、经济学、社会学的批判性分析题。
  • 工程学(4%)及其他学科(9%):涵盖工程设计、艺术史、跨学科前沿问题。

学科分布

hle.torrent
Seeding 1Downloading 0Completed 121Total Downloads 528
  • hle/
    • README.md
      1.69 KB
    • README.txt
      3.37 KB
      • data/
        • hle.zip
          227.35 MB

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供