TextCaps 是一个主要用于图像中的文字识别的数据集。该数据集包含 28,408 张图像及 142,040 条描述。数据集要求模型识别图像中的文本,以决定文本中需要复制或释义的地方。
TextCaps 文字识别数据集
本站暂不支持该数据集下载,如需下载请访问上述「发布地址」进行下载(如可用)
感谢您下载 TextCaps 文字识别数据集!
本站基于知识共享许可协议,为国内用户提供公开数据集高速下载,仅用于科研与学术交流。
获得数据集更新通知、下载过程发现问题、提供未引入数据集资源等,请关注公众号与我们沟通。
感谢您下载 TextCaps 文字识别数据集!

相关数据集推荐
Cops-Ref 目标物指代理解数据集
Cops-Ref 全称 Compositional Referring Expression Comprehension,是关于在目标物指代理解方面的视觉推理图像数据集。该数据集包含 75,299 张真实图像、148,712 条文本描述和 1,307,885 个候选区域。 该数据…

Spot-the-diff 图像描述数据集
Spot-the-diff 数据集由 13,192 个图像对,以及相应的人工提供的文字标注组成。标注阐述了两个图像之间的差异。

SentiCap 图像情感描述数据集
SentiCap 数据集包含带有积极和消极情绪描述的图片。这些情感描述是由作者通过重写事实描述而生成的。总共有 2,000 多条情感描述。 SentiCap 数据集中的图像主要取自于 MS COCO 数据集。从情感的极性出发为图像提供标注,为每幅图像形成 “正面 (positiv…
