Command Palette

Search for a command to run...

OCRBench-v2 文本识别基准数据集

日期

24 天前

大小

6.43 GB

机构

Bytedance(字节跳动)
华中科技大学
华南理工大学

论文链接

2501.00321

*该数据集支持在线使用,点击此处跳转

OCRBench-v2 是由华中科技大学联合华南理工大学、字节跳动等机构于 2025 年发布的一个多模态大型模型光学字符识别(OCR)的评估基准,相关论文成果为「OCRBench v2: An Improved Benchmark for Evaluating Large Multimodal Models on Visual Text Localization and Reasoning」,旨在评估大型多模态模型(LMM)在不同文本相关任务中的 OCR 能力。

该数据集是在 OCRBench 基础上的大规模升级版本,包含 10,000 条经人工验证的中英文问答对作为公开测试集,并额外提供一个私有测试集,包含 1,500 张人工标注的富文本图像,图像来源多样,包括纸质书籍、电子书、扫描文档以及网页内容。数据涵盖 31 个典型文本场景,覆盖 23 个子任务,归类于 8 个核心 OCR 功能(文本识别、文本检测、文本引用定位、关系抽取、元素解析、数学运算、视觉-文本理解、知识推理)。

OCRBenchv2.torrent
做种 1正在下载 0已完成 6总下载次数 29
  • OCRBenchv2/
    • README.md
      1.81 KB
    • README.txt
      3.62 KB
      • data/
        • OCRBenchv2.zip
          6.43 GB

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供