HyperAIHyperAI

Command Palette

Search for a command to run...

Console

GenExam 多学科文生图考试基准数据集

Date

3 个月前

Size

276.88 MB

Organization

上海交通大学
上海人工智能实验室
清华大学

Paper URL

2509.14232

License

MIT

GenExam 是由上海人工智能实验室联合上海交通大学、清华大学等机构于 2025 年发布的首个多学科文本到图像的考试风格基准数据集,相关的论文成果为「GenExam: A Multidisciplinary Text-to-Image Exam」,旨在检验模型是否能够整合理解、推理与生成能力,从而真正解决绘图类问题。

该数据集包含约 1,000 个高质量样本,覆盖数学、物理、化学、生物、计算机科学、工程学、医学、艺术、地理与历史等 10 个学科。每个样本均包含多样且具有挑战性的提示语(prompt)、对应的地面真值图像(ground-truth image),并配备细粒度的评分点(scoring points),全面体现真实考试的严谨性与难度。该数据集的构建分为四个阶段:从约 40,000 张图像出发,经 GPT-5 自动筛选与提示生成,再由博士级专家严格审校,最终沉淀为上述 1,000 个多学科样本。

数据集示例

GenExam.torrent
Seeding 2Downloading 0Completed 9Total Downloads 69
  • GenExam/
    • README.md
      1.83 KB
    • README.txt
      3.65 KB
      • data/
        • GenExam.zip
          276.88 MB

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供