日期
机构
发布地址
textvqa.org
许可协议
其他
标签
图像描述
文本生成
视觉推理
分类
TextCaps 是一个主要用于图像中的文字识别的数据集。该数据集包含 28,408 张图像及 142,040 条描述。数据集要求模型识别图像中的文本,以决定文本中需要复制或释义的地方。