Command Palette
Search for a command to run...
C-MIDN: Coupled Multiple Instance Detection Network mit Segmentierungsleitung für weakly supervised Object Detection
C-MIDN: Coupled Multiple Instance Detection Network mit Segmentierungsleitung für weakly supervised Object Detection
Dongrui Fan Haihang You Fang Wan Xiaochun Ye Nan Guo Boxiao Liu Yan Gao
Zusammenfassung
Schwach beschriftete Objektdetektion (Weakly Supervised Object Detection, WSOD), die lediglich Bild-Level-Anmerkungen benötigt, hat in letzter Zeit erhebliche Aufmerksamkeit erhalten. Durch die Kombination eines Faltungsneuralen Netzes mit der Multiple-Instance-Learning-(MIL-)Methode ist der Multiple Instance Detection Network (MIDN) zur beliebtesten Methode zur Lösung des WSOD-Problems geworden und wird in zahlreichen Arbeiten als Ausgangsmodell verwendet. Wir argumentieren, dass MIDN dazu neigt, sich auf die diskriminativsten Objektteile zu konvergieren, was die Leistung von Methoden, die darauf basieren, einschränkt. In diesem Paper stellen wir einen neuen Coupled Multiple Instance Detection Network (C-MIDN) vor, um dieses Problem zu lösen. Konkret verwenden wir ein Paar von MIDNs, die komplementär arbeiten und dabei Vorschläge entfernen. Die Lokalisationsinformationen der MIDNs werden anschließend weiter gekoppelt, um enger gefasste Bounding Boxes zu erzeugen und mehrere Objekte präziser zu lokalisieren. Zudem führen wir einen Segmentation Guided Proposal Removal (SGPR)-Algorithmus ein, um die MIL-Beschränkung nach der Vorschlagsentfernung zu gewährleisten und die Robustheit des C-MIDN zu sichern. Durch eine einfache Implementierung des C-MIDN mit Online-Detektor-Refinement erreichen wir auf den anspruchsvollen Benchmarks PASCAL VOC 2007 und 2012 jeweils 53,6 % und 50,3 % mAP, was die bisherigen State-of-the-Art-Methoden erheblich übertrifft.