HyperAI超神经

EMMA 多模态推理基准数据集

下载帮助

EMMA(Enhanced MultiModal reAsoning)是由电子科技大学、中山大学、华盛顿大学、微软公司的研究团队于 2025 年发布的多模态推理基准数据集。相关论文成果为:「Can MLLMs Reason in Multimodality? EMMA: An Enhanced MultiModal ReAsoning Benchmark」,旨在为评估多模态大模型(MLLMs)的复杂推理能力提供标准化测试平台。

该数据集聚焦于有机化学(42%)、数学(32%)、物理(6%)和编程(20%)领域的多模态推理任务,包含 2,788 个问题,其中 1,796 个为新构建样本,支持细粒度任务划分,旨在推动图像与文本的联合理解能力。数据任务类型涵盖化学反应模拟、数学图形推理、物理路径追踪、编程可视化等。

数据集中不同学科及其细分任务占比