
摘要
弱监督目标检测是一项具有挑战性的任务,当仅提供图像类别监督时,需要同时学习目标位置和目标检测器。弱监督与学习目标之间的不一致性引入了目标位置的显著随机性和检测器的模糊性。本文提出了一种最小熵潜在模型(Min-Entropy Latent Model, MELM)用于弱监督目标检测。最小熵不仅作为学习目标位置的模型,还作为一种度量来衡量学习过程中目标定位的随机性。该模型旨在从根本上减少所学实例的方差并缓解检测器的模糊性。MELM被分解为三个组件,包括提议聚类划分、对象聚类发现和对象定位。MELM通过一种递归学习算法进行优化,该算法利用连续优化方法解决了具有挑战性的非凸问题。实验结果表明,与现有最先进方法相比,MELM在弱监督目标检测、弱监督目标定位和图像分类方面显著提升了性能。