HyperAIHyperAI

Command Palette

Search for a command to run...

Document Haystack Multimodaler Dokument-Benchmark-Datensatz

Date

vor 5 Monaten

Size

14.6 GB

Organization

Amazonas

Paper URL

2507.15882

Document Haystack ist ein multimodaler Dokument-Benchmark-Datensatz, der 2025 von Amazon AGI veröffentlicht wurde. Die zugehörigen Papierergebnisse sind „Document Haystack: Ein langer Kontext Multimodales Bild/Dokument Verständnis Vision LLM Benchmark“, dessen Ziel es ist, die Fähigkeiten visueller Sprachmodelle (VLMs) zur Informationsbeschaffung und zum Verständnis in komplexen Dokumenten mit langem Kontext zu bewerten.

Der Datensatz enthält 400 Dokumentvarianten und 8.250 Abfragefragen für reale Dokumente mit einer Länge von 5 bis 200 Seiten. Die Datenformate umfassen Original-PDFs, seitenweise Bilder mit 200 DPI und analysierte Textdateien und eignen sich für Aufgaben wie Fragen-Antworten und visuelle Fragen-Antworten.

document-haystack.torrent
Seeding 1Downloading 0Completed 43Total Downloads 122
  • document-haystack/
    • README.md
      1.38 KB
    • README.txt
      2.76 KB
      • data/
        • document-haystack.zip
          14.6 GB

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp