
摘要
本文解决了在无需任何监督的情况下发现图像集合中存在物体的问题。我们在Vo等人(CVPR 2019)的优化方法基础上进行了几项关键创新:(1) 我们提出了一种基于显著性的区域提议算法,该算法在与其他竞争方法相比时,与真实物体的重叠率显著提高。此过程利用了经过分类任务训练但未使用任何边界框信息的现成CNN特征,除此之外完全无监督。(2) 我们利用提议固有的层次结构作为Vo等人提出的物体发现方法的有效正则化手段,从而在多个标准基准测试中大幅超越现有技术水平。(3) 我们采用两阶段策略,首先使用小规模随机图像集选择有潜力的提议,然后再使用整个图像集合来发现其所描绘的物体。据我们所知,这是首次实现对包含多达20,000张图像的数据集中每张图片中的多个物体进行发现,相比现有方法提高了五倍以上,并且是迈向真正大规模无监督图像解释的第一步。