Flickr30K Entities 是 Flickr30K 数据集的扩展。Flickr30K Entities 标注了 Flickr30K 数据集描述句子里提到的名词,并标注了对应的 bounding box。
该数据集为原来的 158K 个描述句子增加了 244K 条共指链 (coreference chain),将同一图片中不同描述句子对同一实体的提及联系起来,并将它们与 276K 个手动标注的边界框关联起来。该数据集被用来定义一个新的基准,用于图像中文本实体提及的本地化。
2 做种
0 下载
227 已完成
- Flickr30K_Entities/README.md 1.23 KB
- Flickr30K_Entities/README.txt 1.23 KB
- Flickr30K_Entities/data/flickr30k-images.tar 4.14 GB
- Flickr30K_Entities/data/flickr30k.tar.gz 3.48 MB
- Flickr30K_Entities/data/flickr30k_test.py 176 B