Diesen Datensatz verwenden Auf Discord diskutieren

Datum

vor 3 Monaten

Paper-URL

2604.08538

Lizenz

Apache 2.0

Tags

Dokumentenverstehen

Intelligente Fragebeantwortung

OCR

Benchmarks

Der Datensatz zur Evaluierung der Dokumentenanalysefähigkeit ParseBench wurde vom LlamaIndex-Team in den Jahren 2024–2025 veröffentlicht, und die zugehörigen wissenschaftlichen Ergebnisse lauten wie folgt: ParseBench: Ein Benchmark für die Dokumentenanalyse von KI-AgentenZiel ist es, die Weiterentwicklung der Dokumentenanalyse von der traditionellen OCR hin zum strukturierten Verständnis zu fördern und die Evaluierung und Optimierung multimodaler Modelle und Informationsextraktionssysteme zu unterstützen. Dieser Datensatz umfasst ca. 2.000 manuell validierte und annotierte Seiten sowie 169.011 Testregeln in fünf Dimensionen. Die Seiten stammen aus öffentlich zugänglichen Unternehmensdokumenten der Branchen Versicherung, Finanzen, Verwaltung und anderen Sektoren und beinhalten verschiedene Seitentypen wie PDFs, Scans und Seiten mit Tabellen und Layouts. Standardisierte Analyseergebnisse werden bereitgestellt und mit manuellen Annotationen abgeglichen, um die Leistungsfähigkeit des Modells hinsichtlich Strukturverständnis und Informationsextraktion zu bewerten.

Dieser Datensatz wurde von Community-Nutzern beigesteuert und dient ausschließlich Bildungs- und Informationszwecken. Falls Inhalte eine Urheberrechtsverletzung darstellen, kontaktieren Sie uns bitte unter [email protected] zur umgehenden Prüfung und Entfernung.

Command Palette

ParseBench-Dokumentparsing-Fähigkeitsbewertungsdatensatz

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

ParseBench-Dokumentparsing-Fähigkeitsbewertungsdatensatz

Zugehörige Datensätze

Transfermarkt Fußballdatensatz

PanScale Remote Sensing Pancolor Sharpening Dataset

Emotion-Probes-Datensatz Zur Emotionserkennung

MIA-Datensatz Für Mehrstufige Inferenz Und Entscheidungstrajektorien

OmniParsingBench Multimodal Parsing Capability Evaluation Dataset

MDPBench Multilingual Document Parsing Benchmark Dataset

Datensatz „Einfache Sprachfragen“

GPT-5.4-Schritt-für-Schritt-Schlussfolgerungsdatensatz

DRACO Cross-Domain Deep Research Benchmark-Datensatz

Nemotron Personas Frankreich (Französischer Datensatz Synthetischer Personas)

Groundsource Global Flood Events Dataset

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

ParseBench-Dokumentparsing-Fähigkeitsbewertungsdatensatz

Zugehörige Datensätze

Transfermarkt Fußballdatensatz

PanScale Remote Sensing Pancolor Sharpening Dataset

Emotion-Probes-Datensatz Zur Emotionserkennung

MIA-Datensatz Für Mehrstufige Inferenz Und Entscheidungstrajektorien

OmniParsingBench Multimodal Parsing Capability Evaluation Dataset

MDPBench Multilingual Document Parsing Benchmark Dataset

Datensatz „Einfache Sprachfragen“

GPT-5.4-Schritt-für-Schritt-Schlussfolgerungsdatensatz

DRACO Cross-Domain Deep Research Benchmark-Datensatz

Nemotron Personas Frankreich (Französischer Datensatz Synthetischer Personas)

Groundsource Global Flood Events Dataset

KI mit KI entwickeln

HyperAI Newsletters

Zugehörige Datensätze

Transfermarkt Fußballdatensatz

PanScale Remote Sensing Pancolor Sharpening Dataset

Emotion-Probes-Datensatz Zur Emotionserkennung

MIA-Datensatz Für Mehrstufige Inferenz Und Entscheidungstrajektorien

OmniParsingBench Multimodal Parsing Capability Evaluation Dataset

MDPBench Multilingual Document Parsing Benchmark Dataset

Datensatz „Einfache Sprachfragen“

GPT-5.4-Schritt-für-Schritt-Schlussfolgerungsdatensatz

DRACO Cross-Domain Deep Research Benchmark-Datensatz

Nemotron Personas Frankreich (Französischer Datensatz Synthetischer Personas)

Groundsource Global Flood Events Dataset

Zugehörige Datensätze

Transfermarkt Fußballdatensatz

PanScale Remote Sensing Pancolor Sharpening Dataset

Emotion-Probes-Datensatz Zur Emotionserkennung

MIA-Datensatz Für Mehrstufige Inferenz Und Entscheidungstrajektorien

OmniParsingBench Multimodal Parsing Capability Evaluation Dataset

MDPBench Multilingual Document Parsing Benchmark Dataset

Datensatz „Einfache Sprachfragen“

GPT-5.4-Schritt-für-Schritt-Schlussfolgerungsdatensatz

DRACO Cross-Domain Deep Research Benchmark-Datensatz

Nemotron Personas Frankreich (Französischer Datensatz Synthetischer Personas)

Groundsource Global Flood Events Dataset