Command Palette

Search for a command to run...

M2RAG 多模态评估基准数据集

日期

7 个月前

大小

5.46 GB

机构

论文链接

arxiv.org

标签

M2RAG 是一个用于评估多模态大语言模型 (MLLMs) 在多模态检索场景下的能力的多模态数据集,旨在评估 MLLMs 在图像描述、多模态问答、事实验证和图像重排序等任务中利用多模态检索文档知识能力。相关论文成果为「Benchmarking Retrieval-Augmented Generation in Multi-Modal Contexts」。

该数据集将图像和文本数据相结合,模拟真实场景中的信息检索与生成任务,例如新闻事件分析、视觉问答等,着重评估 MLLMs 在多模态上下文中利用检索文档知识的能力,包括对图像内容的理解、图文关联推理以及事实判断等方面。

M2RAG 基准测试任务示例
M2RAG.torrent
做种 1正在下载 0已完成 87总下载次数 155
  • M2RAG/
    • README.md
      1.45 KB
    • README.txt
      2.9 KB
      • data/
        • M2RAG.zip
          5.46 GB

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供