HyperAI
Command Palette
Search for a command to run...
OmniParsingBench 多模态解析能力评估数据集
OmniParsingBench 是由阿里巴巴于 2026 年发布的一个面向多模态大模型(MLLM)统一解析能力评估的基准数据集,相关论文成果为 Logics-Parsing-Omni Technical Report,旨在突破传统单任务评测的局限,系统评估模型从感知到认知的全流程能力,广泛应用于多模态理解、结构化信息提取及复杂推理能力研究等场景。 该数据集包含约 5,294 条样本,覆盖 6 大模态领域(自然图像、图形、文档、音频、自然视频与文本密集视频),并引入感知(Perc.)、认知(Cog.)和总体(Ovr.)3 层评测指标。每条数据包含图像或音视频输入及对应的结构化解析任务。
此数据集由社区用户贡献,仅用于教育和信息目的。如有任何内容涉及版权侵权,请通过 [email protected] 联系我们,我们将及时审核并删除。