Date

3 months ago

Paper URL

2604.08538

License

Apache 2.0

Tags

Document Understanding

Intelligent Question Answering

OCR

Benchmarks

The ParseBench document parsing capability evaluation dataset was released by the LlamaIndex team in 2024–2025, and the related paper results are as follows: ParseBench: A Document Parsing Benchmark for AI AgentsIt aims to promote the evolution of document parsing from traditional OCR to structured understanding, and support the evaluation and optimization of multimodal models and information extraction systems. This dataset contains approximately 2,000 manually validated and labeled pages and 169,011 test rules across five dimensions. These pages are taken from publicly available corporate documents covering insurance, finance, government, and other sectors, encompassing various page types including PDFs, scanned images, and pages containing tables and layout structures. Standardized parsing results are provided and aligned with human annotations to evaluate the model's performance in structural understanding and information extraction.

This dataset is contributed by community users and is intended for educational and informational purposes only. If any content involves copyright infringement, please contact us at [email protected] for prompt review and removal.

Command Palette

ParseBench Document Parsing Capability Evaluation Dataset

Build AI with AI

HyperAI Newsletters

Command Palette

ParseBench Document Parsing Capability Evaluation Dataset

Related Datasets

Transfermarkt Football Dataset

PanScale Remote Sensing Pancolor Sharpening Dataset

Emotion-probes Emotion Detection Dataset

MIA Multistep Inference and Decision Trajectory Dataset

OmniParsingBench Multimodal Parsing Capability Evaluation Dataset

MDPBench Multilingual Document Parsing Benchmark Dataset

Simple Voice Questions Dataset

GPT-5.4-step-by-step-reasoning Dataset

DRACO Cross-Disciplinary Deep Research Benchmark Dataset

Nemotron Personas France (French Synthetic Personas Dataset)

Groundsource Global Flood Events Dataset

Build AI with AI

HyperAI Newsletters

Command Palette

ParseBench Document Parsing Capability Evaluation Dataset

Related Datasets

Transfermarkt Football Dataset

PanScale Remote Sensing Pancolor Sharpening Dataset

Emotion-probes Emotion Detection Dataset

MIA Multistep Inference and Decision Trajectory Dataset

OmniParsingBench Multimodal Parsing Capability Evaluation Dataset

MDPBench Multilingual Document Parsing Benchmark Dataset

Simple Voice Questions Dataset

GPT-5.4-step-by-step-reasoning Dataset

DRACO Cross-Disciplinary Deep Research Benchmark Dataset

Nemotron Personas France (French Synthetic Personas Dataset)

Groundsource Global Flood Events Dataset

Build AI with AI

HyperAI Newsletters

Related Datasets

Transfermarkt Football Dataset

PanScale Remote Sensing Pancolor Sharpening Dataset

Emotion-probes Emotion Detection Dataset

MIA Multistep Inference and Decision Trajectory Dataset

OmniParsingBench Multimodal Parsing Capability Evaluation Dataset

MDPBench Multilingual Document Parsing Benchmark Dataset

Simple Voice Questions Dataset

GPT-5.4-step-by-step-reasoning Dataset

DRACO Cross-Disciplinary Deep Research Benchmark Dataset

Nemotron Personas France (French Synthetic Personas Dataset)

Groundsource Global Flood Events Dataset

Related Datasets

Transfermarkt Football Dataset

PanScale Remote Sensing Pancolor Sharpening Dataset

Emotion-probes Emotion Detection Dataset

MIA Multistep Inference and Decision Trajectory Dataset

OmniParsingBench Multimodal Parsing Capability Evaluation Dataset

MDPBench Multilingual Document Parsing Benchmark Dataset

Simple Voice Questions Dataset

GPT-5.4-step-by-step-reasoning Dataset

DRACO Cross-Disciplinary Deep Research Benchmark Dataset

Nemotron Personas France (French Synthetic Personas Dataset)

Groundsource Global Flood Events Dataset