Flickr30K Entities 是 Flickr30K 数据集的扩展。 Flickr30K Entities 标注了 Flickr30K 数据集描述句子里提到的名词,并标注了对应的 bounding box 。
该数据集为原来的 158K 个描述句子增加了 244K 条共指链 (coreference chain),将同一图片中不同描述句子对同一实体的提及联系起来,并将它们与 276K 个手动标注的边界框关联起来。该数据集被用来定义一个新的基准,用于图像中文本实体提及的本地化。
做种 1
下载中 0
已完成 329
总下载 657