Command Palette

Search for a command to run...

TextOCR 文本识别数据集

日期

3 年前

机构

发布地址

textvqa.org

论文链接

arxiv.org

许可协议

CC BY 4.0

加入 Discord 社区
Featured Image

OCR 全称 optical character recognition,TextOCR 是用于对任意场景文本进行检测和识别的数据集。 TextOCR 为 TextVQA 中的图像提供了约 100 万个高质量的词汇标注,并且能在视觉问答或图像说明等下游任务上实行端到端的推理。

该数据集包括:

  • 28,134 张来自 TextVQA 数据集的图像
  • 903,096 个带有标注的场景文本词
  • 平均每张图像带有 32 个相关词

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供