日期

3 年前

数据集组织

发布 URL

github.com

论文 URL

arxiv.org

许可证

Other

标签

目标检测

Cops-Ref 全称 Compositional Referring Expression Comprehension，是关于在目标物指代理解方面的视觉推理图像数据集。该数据集包含 75,299 张真实图像、 148,712 条文本描述和 1,307,885 个候选区域。该数据集有两个主要特点，一是新的文本生成引擎，它能结合推理逻辑和视觉特征，进而生成不同复杂程度的文本描述；二是新的测试设置，在测试过程中对有语义相似的视觉图像进行干扰。

Citation

@inroceedings{Chen_2020_CVPR, author = {Chen, Zhenfang and Wang, Peng and Ma, Lin and Wong, Kwan-Yee~K. and Wu, Qi}, title = {Cops-Ref: A New Dataset and Task on Compositional Referring Expression Comprehension}, booktitle = {Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR)}, month = {June}, year = {2020} }

此数据集由社区用户贡献,仅用于教育和信息目的。如有任何内容涉及版权侵权,请通过 [email protected] 联系我们,我们将及时审核并删除。