Command Palette

Search for a command to run...

Document Haystack 多模态文档基准数据集

日期

3 个月前

大小

14.6 GB

机构

Amazon

论文链接

2507.15882

Document Haystack 是由 Amazon AGI 于 2025 年发布的一个多模态文档基准数据集,相关论文成果为「Document Haystack: A Long Context Multimodal Image/Document Understanding Vision LLM Benchmark」,旨在评估视觉语言模型(VLM)在长上下文复杂文档中的信息检索与理解能力。

该数据集包含 400 份文档变体和 8,250 个检索问题,涵盖了 5-200 页篇幅的真实文档,数据形式包括原始 PDF 、 200 DPI 分页图像和纯文本解析文件,适用于问答(Question-Answering)和视觉问答(Visual Question-Answering)等任务。

document-haystack.torrent
做种 1正在下载 0已完成 34总下载次数 85
  • document-haystack/
    • README.md
      1.38 KB
    • README.txt
      2.76 KB
      • data/
        • document-haystack.zip
          14.6 GB

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供