HyperAIHyperAI

Command Palette

Search for a command to run...

M2RAG 多模态评估基准数据集

Date

9 个月前

Size

5.46 GB

Organization

Paper URL

arxiv.org

M2RAG 是一个用于评估多模态大语言模型 (MLLMs) 在多模态检索场景下的能力的多模态数据集,旨在评估 MLLMs 在图像描述、多模态问答、事实验证和图像重排序等任务中利用多模态检索文档知识能力。相关论文成果为「Benchmarking Retrieval-Augmented Generation in Multi-Modal Contexts」。

该数据集将图像和文本数据相结合,模拟真实场景中的信息检索与生成任务,例如新闻事件分析、视觉问答等,着重评估 MLLMs 在多模态上下文中利用检索文档知识的能力,包括对图像内容的理解、图文关联推理以及事实判断等方面。

M2RAG 基准测试任务示例
M2RAG.torrent
Seeding 1Downloading 0Completed 100Total Downloads 184
  • M2RAG/
    • README.md
      1.45 KB
    • README.txt
      2.9 KB
      • data/
        • M2RAG.zip
          5.46 GB

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供