Command Palette

Search for a command to run...

OCRBench 文本识别基准数据集

日期

4 个月前

大小

60.8 MB

机构

华中科技大学

论文链接

arxiv.org

OCRBench 是由华中科技大学联合微软研究院发布的一个文本识别基准数据集,该数据集是多模态大型模型光学字符识别(OCR)的评估基准,相关论文成果为:「OCRBench: On the Hidden Mystery of OCR in Large Multimodal Models」,旨在评估大型多模态模型(LMM)在不同文本相关任务中的 OCR 能力。

该数据集包含 1000 个手动筛选和校正的问答对,这些问答对来自 5 项具有代表性的文本相关任务:文本识别、场景文本中心、文档导向、关键信息(KIE)和手写数学表达式(HMER)。

数据包含:

  • 文本识别 300 张图像(含常规、不规则、艺术等多种文本类型)。
  • 场景文本中心视觉问答 200 个问题。
  • 文档导向视觉问答 200 个问题。
  • 关键信息提取 200 个问题。
  • 手写数学表达式识别 100 张 HME100k 数据集图像。
OCRBench.torrent
做种 2正在下载 0已完成 67总下载次数 169
  • OCRBench/
    • README.md
      1.65 KB
    • README.txt
      3.3 KB
      • data/
        • OCRBench.zip
          60.8 MB

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供