Command Palette
Search for a command to run...
ParseBench-Dokumentparsing-Fähigkeitsbewertungsdatensatz
Datum
Paper-URL
Lizenz
Apache 2.0
Der Datensatz zur Evaluierung der Dokumentenanalysefähigkeit ParseBench wurde vom LlamaIndex-Team in den Jahren 2024–2025 veröffentlicht, und die zugehörigen wissenschaftlichen Ergebnisse lauten wie folgt: ParseBench: Ein Benchmark für die Dokumentenanalyse von KI-AgentenZiel ist es, die Weiterentwicklung der Dokumentenanalyse von der traditionellen OCR hin zum strukturierten Verständnis zu fördern und die Evaluierung und Optimierung multimodaler Modelle und Informationsextraktionssysteme zu unterstützen. Dieser Datensatz umfasst ca. 2.000 manuell validierte und annotierte Seiten sowie 169.011 Testregeln in fünf Dimensionen. Die Seiten stammen aus öffentlich zugänglichen Unternehmensdokumenten der Branchen Versicherung, Finanzen, Verwaltung und anderen Sektoren und beinhalten verschiedene Seitentypen wie PDFs, Scans und Seiten mit Tabellen und Layouts. Standardisierte Analyseergebnisse werden bereitgestellt und mit manuellen Annotationen abgeglichen, um die Leistungsfähigkeit des Modells hinsichtlich Strukturverständnis und Informationsextraktion zu bewerten.
KI mit KI entwickeln
Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.