HyperAI超神经

HLE 人类问题推理基准数据集

HLE 是由人工智能安全中心(Center for AI Safety)与 Scale AI 联合发布的一个多模态人类问题基准数据集,相关论文成果为:「Humanity’s Last Exam」,旨在构建覆盖人类知识前沿的终极封闭式评估体系。

该数据集包含 2500 道题目,覆盖数学、人文科学、自然科学等数十个学科,其中包含适合自动评分的选择题和简答题。

学科分布:

  • 数学(41%):高等数学、概率论、算法设计等抽象问题。
  • 计算机科学 / 人工智能(10%):机器学习理论、计算复杂性、自然语言处理。
  • 自然科学(27%):物理(9%)、化学(7%)、生物 / 医学(11%),涉及量子物理、有机合成、病理机制等。
  • 人文 / 社会科学(9%):哲学、历史、经济学、社会学的批判性分析题。
  • 工程学(4%)及其他学科(9%):涵盖工程设计、艺术史、跨学科前沿问题。

学科分布

hle.torrent
做种 1正在下载 0已完成 0总下载次数 2
  • hle/
    • README.md
      1.69 KB
    • README.txt
      3.37 KB
      • data/
        • hle.zip
          227.35 MB