2 个月前

C-MIDN:基于分割引导的耦合多实例检测网络用于弱监督目标检测

{ Dongrui Fan, Haihang You, Fang Wan, Xiaochun Ye, Nan Guo, Boxiao Liu, Yan Gao}
C-MIDN:基于分割引导的耦合多实例检测网络用于弱监督目标检测
摘要

近年来,仅需图像级标注的弱监督目标检测(Weakly Supervised Object Detection, WSOD)方法受到广泛关注。通过将卷积神经网络与多实例学习(Multiple Instance Learning, MIL)相结合,多实例检测网络(Multiple Instance Detection Network, MIDN)已成为解决WSOD问题最主流的方法,并被广泛用作众多相关研究的初始模型。然而,我们指出,MIDN倾向于收敛至最具判别性的物体局部区域,这一特性限制了基于该方法的性能提升。为此,本文提出一种新型的耦合多实例检测网络(Coupled Multiple Instance Detection Network, C-MIDN),以解决上述问题。具体而言,C-MIDN采用一对MIDN结构,二者以互补方式协同工作,并引入候选区域移除机制。通过进一步耦合两个MIDN的定位信息,可获得更紧致的边界框,并实现对多个物体的准确定位。此外,我们设计了一种分割引导的候选区域移除算法(Segmentation Guided Proposal Removal, SGPR),在移除候选区域后仍能有效维持MIL约束,从而保障C-MIDN的鲁棒性。通过一种简洁的在线检测器精炼实现方式,C-MIDN在具有挑战性的PASCAL VOC 2007和2012基准测试中分别取得了53.6%和50.3%的mAP,显著优于此前的最先进方法。