日期

3 个月前

论文 URL

2604.08538

许可证

Apache 2.0

标签

ParseBench 文档解析能力评测数据集由 LlamaIndex 团队于 2024–2025 年发布，相关论文成果为 ParseBench: A Document Parsing Benchmark for AI Agents，旨在推动文档解析从传统 OCR 向结构化理解演进，支持多模态模型与信息抽取系统的评估与优化。该数据集包含约 2,000 个经人工验证和标注的页面和五个维度的 169,011 条测试规则。这些页面取自公开的企业文档，涵盖保险、金融、政府和其他领域，涵盖 PDF 、扫描图像及包含表格与版面结构等多类型页面，并提供标准化解析结果与人工标注对齐，用于评测模型在结构理解与信息抽取方面的表现。

此数据集由社区用户贡献,仅用于教育和信息目的。如有任何内容涉及版权侵权,请通过 [email protected] 联系我们,我们将及时审核并删除。

Command Palette

ParseBench 文档解析能力评测数据集

用 AI 构建 AI

HyperAI Newsletters

Command Palette

ParseBench 文档解析能力评测数据集

相关数据集

Transfermarkt Football 足球转会数据集

PanScale 遥感全色锐化数据集

Emotion-probes 情绪探测数据集

MIA 多步推理与决策轨迹数据集

OmniParsingBench 多模态解析能力评估数据集

MDPBench 多语言文档解析基准数据集

Simple Voice Questions 简单语音问题数据集

GPT-5.4-step-by-step-reasoning 逐步推理数据集

DRACO 跨领域深度研究基准数据集

Nemotron Personas France 法国合成人物数据集

Groundsource 全球洪水事件数据集

用 AI 构建 AI

HyperAI Newsletters

Command Palette

ParseBench 文档解析能力评测数据集

相关数据集

Transfermarkt Football 足球转会数据集

PanScale 遥感全色锐化数据集

Emotion-probes 情绪探测数据集

MIA 多步推理与决策轨迹数据集

OmniParsingBench 多模态解析能力评估数据集

MDPBench 多语言文档解析基准数据集

Simple Voice Questions 简单语音问题数据集

GPT-5.4-step-by-step-reasoning 逐步推理数据集

DRACO 跨领域深度研究基准数据集

Nemotron Personas France 法国合成人物数据集

Groundsource 全球洪水事件数据集

用 AI 构建 AI

HyperAI Newsletters

相关数据集

Transfermarkt Football 足球转会数据集

PanScale 遥感全色锐化数据集

Emotion-probes 情绪探测数据集

MIA 多步推理与决策轨迹数据集

OmniParsingBench 多模态解析能力评估数据集

MDPBench 多语言文档解析基准数据集

Simple Voice Questions 简单语音问题数据集

GPT-5.4-step-by-step-reasoning 逐步推理数据集

DRACO 跨领域深度研究基准数据集

Nemotron Personas France 法国合成人物数据集

Groundsource 全球洪水事件数据集

相关数据集

Transfermarkt Football 足球转会数据集

PanScale 遥感全色锐化数据集

Emotion-probes 情绪探测数据集

MIA 多步推理与决策轨迹数据集

OmniParsingBench 多模态解析能力评估数据集

MDPBench 多语言文档解析基准数据集

Simple Voice Questions 简单语音问题数据集

GPT-5.4-step-by-step-reasoning 逐步推理数据集

DRACO 跨领域深度研究基准数据集

Nemotron Personas France 法国合成人物数据集

Groundsource 全球洪水事件数据集