日期

3 个月前

数据集组织

论文 URL

2603.09677

许可证

Apache 2.0

标签

OmniParsingBench 是由阿里巴巴于 2026 年发布的一个面向多模态大模型（MLLM）统一解析能力评估的基准数据集，相关论文成果为 Logics-Parsing-Omni Technical Report，旨在突破传统单任务评测的局限，系统评估模型从感知到认知的全流程能力，广泛应用于多模态理解、结构化信息提取及复杂推理能力研究等场景。该数据集包含约 5,294 条样本，覆盖 6 大模态领域（自然图像、图形、文档、音频、自然视频与文本密集视频），并引入感知（Perc.）、认知（Cog.）和总体（Ovr.）3 层评测指标。每条数据包含图像或音视频输入及对应的结构化解析任务。

Citation

@article{logicsparsingomni2026, title={Logics-Parsing-Omni: Bridging Fine-Grained Perception and Semantic Cognition in Multimodal Parsing}, author={Logics Team}, journal={arXiv preprint arXiv:2603.09677}, year={2026} }

此数据集由社区用户贡献,仅用于教育和信息目的。如有任何内容涉及版权侵权,请通过 [email protected] 联系我们,我们将及时审核并删除。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

HyperAI

使用此数据集在 Discord 上讨论

日期

3 个月前

数据集组织

论文 URL

2603.09677

许可证

Apache 2.0

标签

MDPBench 多语言文档解析基准数据集

1 个月前

GPT-5.4-step-by-step-reasoning 逐步推理数据集

3 个月前

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

Command Palette

OmniParsingBench 多模态解析能力评估数据集

Citation

用 AI 构建 AI

HyperAI Newsletters

Command Palette

OmniParsingBench 多模态解析能力评估数据集

Citation

相关数据集

Global Climate & Energy Transition 2000 – 2026 全球气候能源数据集

Verbatim Spans 查询条件证据提取数据集

SAM 3D Artist Objects 3D 物体重建数据集

FigureBench 科学插图生成基准数据集

TACK 靶向嵌合体知识库数据集

EAVSD 电商广告视频分镜数据集

chi-bench 医疗智能体基准评测数据集

ViMU 视频隐喻理解数据集

VisCoR-55K 视觉推理数据集

LongBlocks 长上下文多语言问答数据集

MathNet 多模态数学基准推理数据集

Claw-Eval 真实世界评测基准数据集

QCalEval 量子校准图表理解数据集

RSRCC 遥感区域变化理解基准数据集

PanScale 遥感全色锐化数据集

ParseBench 文档解析能力评测数据集

Emotion-probes 情绪探测数据集

MIA 多步推理与决策轨迹数据集

MDPBench 多语言文档解析基准数据集

GPT-5.4-step-by-step-reasoning 逐步推理数据集

用 AI 构建 AI

HyperAI Newsletters

Command Palette

OmniParsingBench 多模态解析能力评估数据集

Citation

相关数据集

Global Climate & Energy Transition 2000 – 2026 全球气候能源数据集

Verbatim Spans 查询条件证据提取数据集

SAM 3D Artist Objects 3D 物体重建数据集

FigureBench 科学插图生成基准数据集

TACK 靶向嵌合体知识库数据集

EAVSD 电商广告视频分镜数据集

chi-bench 医疗智能体基准评测数据集

ViMU 视频隐喻理解数据集

VisCoR-55K 视觉推理数据集

LongBlocks 长上下文多语言问答数据集

MathNet 多模态数学基准推理数据集

Claw-Eval 真实世界评测基准数据集

QCalEval 量子校准图表理解数据集

RSRCC 遥感区域变化理解基准数据集

PanScale 遥感全色锐化数据集

ParseBench 文档解析能力评测数据集

Emotion-probes 情绪探测数据集

MIA 多步推理与决策轨迹数据集

MDPBench 多语言文档解析基准数据集

GPT-5.4-step-by-step-reasoning 逐步推理数据集

用 AI 构建 AI

HyperAI Newsletters

相关数据集

Global Climate & Energy Transition 2000 – 2026 全球气候能源数据集

Verbatim Spans 查询条件证据提取数据集

SAM 3D Artist Objects 3D 物体重建数据集

FigureBench 科学插图生成基准数据集

TACK 靶向嵌合体知识库数据集

EAVSD 电商广告视频分镜数据集

chi-bench 医疗智能体基准评测数据集

ViMU 视频隐喻理解数据集

VisCoR-55K 视觉推理数据集

LongBlocks 长上下文多语言问答数据集

MathNet 多模态数学基准推理数据集

Claw-Eval 真实世界评测基准数据集

QCalEval 量子校准图表理解数据集

RSRCC 遥感区域变化理解基准数据集

PanScale 遥感全色锐化数据集

ParseBench 文档解析能力评测数据集

Emotion-probes 情绪探测数据集

MIA 多步推理与决策轨迹数据集

MDPBench 多语言文档解析基准数据集

GPT-5.4-step-by-step-reasoning 逐步推理数据集

相关数据集

Global Climate & Energy Transition 2000 – 2026 全球气候能源数据集