HLE 是由人工智能安全中心(Center for AI Safety)与 Scale AI 联合发布的一个多模态人类问题基准数据集,相关论文成果为:「Humanity’s Last Exam」,旨在构建覆盖人类知识前沿的终极封闭式评估体系。
该数据集包含 2500 道题目,覆盖数学、人文科学、自然科学等数十个学科,其中包含适合自动评分的选择题和简答题。
学科分布:
- 数学(41%):高等数学、概率论、算法设计等抽象问题。
- 计算机科学 / 人工智能(10%):机器学习理论、计算复杂性、自然语言处理。
- 自然科学(27%):物理(9%)、化学(7%)、生物 / 医学(11%),涉及量子物理、有机合成、病理机制等。
- 人文 / 社会科学(9%):哲学、历史、经济学、社会学的批判性分析题。
- 工程学(4%)及其他学科(9%):涵盖工程设计、艺术史、跨学科前沿问题。

学科分布
hle.torrent
做种 1正在下载 0已完成 0总下载次数 2