
摘要
弱监督物体检测是图像理解领域的一个重要问题,目前尚未找到令人满意的解决方案。本文通过利用在大规模图像级分类任务上预训练的深度卷积神经网络来解决这一问题。我们提出了一种弱监督深度检测架构,该架构对其中一个网络进行了修改,使其能够在图像区域级别运行,同时执行区域选择和分类。作为图像分类器进行训练时,该架构隐式地学习到了优于其他弱监督检测系统的物体检测器,在PASCAL VOC数据集上的表现尤为突出。此外,这一模型采用了简单而优雅的端到端架构,在图像级分类任务中也超越了标准的数据增强和微调技术。