Command Palette

Search for a command to run...

GenExam 多学科文生图考试基准数据集

日期

1 个月前

大小

276.88 MB

机构

上海交通大学
上海人工智能实验室
清华大学

论文链接

2509.14232

许可协议

MIT

*该数据集支持在线使用,点击此处跳转

GenExam 是由上海人工智能实验室联合上海交通大学、清华大学等机构于 2025 年发布的首个多学科文本到图像的考试风格基准数据集,相关的论文成果为「GenExam: A Multidisciplinary Text-to-Image Exam」,旨在检验模型是否能够整合理解、推理与生成能力,从而真正解决绘图类问题。

该数据集包含约 1,000 个高质量样本,覆盖数学、物理、化学、生物、计算机科学、工程学、医学、艺术、地理与历史等 10 个学科。每个样本均包含多样且具有挑战性的提示语(prompt)、对应的地面真值图像(ground-truth image),并配备细粒度的评分点(scoring points),全面体现真实考试的严谨性与难度。该数据集的构建分为四个阶段:从约 40,000 张图像出发,经 GPT-5 自动筛选与提示生成,再由博士级专家严格审校,最终沉淀为上述 1,000 个多学科样本。

数据集示例

GenExam.torrent
做种 1正在下载 0已完成 6总下载次数 25
  • GenExam/
    • README.md
      1.83 KB
    • README.txt
      3.65 KB
      • data/
        • GenExam.zip
          276.88 MB

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
GenExam 多学科文生图考试基准数据集 | 数据集 | HyperAI超神经