在 Discord 上讨论

日期

4 年前

数据集组织

发布 URL

论文 URL

许可证

CC BY 4.0

标签

OCR 全称 optical character recognition，TextOCR 是用于对任意场景文本进行检测和识别的数据集。 TextOCR 为 TextVQA 中的图像提供了约 100 万个高质量的词汇标注，并且能在视觉问答或图像说明等下游任务上实行端到端的推理。 该数据集包括：

28,134 张来自 TextVQA 数据集的图像
903,096 个带有标注的场景文本词
平均每张图像带有 32 个相关词

此数据集由社区用户贡献,仅用于教育和信息目的。如有任何内容涉及版权侵权,请通过 [email protected] 联系我们,我们将及时审核并删除。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供