7 个月前

摘要

我们的目标是在仅使用图像级监督的情况下对图像中的物体进行定位。以往针对这一问题的方法主要集中在判别性物体区域上，通常无法精确定位物体边界。为了解决这一问题，我们引入了两种上下文感知引导模型——加性模型和对比模型，这些模型利用其周围的上下文区域来提高定位精度。加性模型鼓励预测的物体区域得到其周围上下文区域的支持。对比模型则鼓励预测的物体区域从其周围上下文区域中脱颖而出。我们的方法受益于卷积神经网络在物体识别方面的最新进展，并扩展了Fast R-CNN以实现弱监督下的物体定位。在PASCAL VOC 2007和2012基准数据集上的大量实验评估表明，我们的上下文感知方法显著提高了弱监督下的定位和检测性能。

源 PDF