HyperAI超神经

EMMA 多模态推理基准数据集

日期

2 months ago

大小

228.19 MB

机构

Microsoft
University of Washington
中山大学

发布地址

huggingface.co

EMMA(Enhanced MultiModal reAsoning)是由电子科技大学、中山大学、华盛顿大学、微软公司的研究团队于 2025 年发布的多模态推理基准数据集。相关论文成果为:「Can MLLMs Reason in Multimodality? EMMA: An Enhanced MultiModal ReAsoning Benchmark」,旨在为评估多模态大模型(MLLMs)的复杂推理能力提供标准化测试平台。

该数据集聚焦于有机化学(42%)、数学(32%)、物理(6%)和编程(20%)领域的多模态推理任务,包含 2,788 个问题,其中 1,796 个为新构建样本,支持细粒度任务划分,旨在推动图像与文本的联合理解能力。数据任务类型涵盖化学反应模拟、数学图形推理、物理路径追踪、编程可视化等。

数据集中不同学科及其细分任务占比

EMMA.torrent
做种 1正在下载 0已完成 18总下载次数 47
  • EMMA/
    • README.md
      1.6 KB
    • README.txt
      3.21 KB
      • data/
        • EMMA.zip
          228.19 MB