TextOCR 文本识别数据集

本站暂不支持该数据集下载,如需下载请访问上述「发布地址」进行下载(如可用)

OCR 全称 optical character recognition,TextOCR 是用于对任意场景文本进行检测和识别的数据集。TextOCR 为 TextVQA 中的图像提供了约 100 万个高质量的词汇标注,并且能在视觉问答或图像说明等下游任务上实行端到端的推理。

该数据集包括:

  • 28,134 张来自 TextVQA 数据集的图像
  • 903,096 个带有标注的场景文本词
  • 平均每张图像带有 32 个相关词