Zyklische Anleitung für schwach überwachte gemeinsame Detektion und Segmentierung

Schwach überwachtes Lernen hat aufgrund der erheblichen Einsparung an Anmerkungskosten für Aufgaben, die intra-bildliche Annotationen erfordern, wie beispielsweise Objektdetektion und semantische Segmentierung, zunehmend an Forschungsinteresse gewonnen. Um dieses Ziel zu erreichen, folgen bestehende Ansätze im schwach überwachten Objektdetektions- und Segmentierungsbereich einem iterativen Label-Mining- und Modelltrainings-Pipeline. Allerdings führt solch ein selbstverstärkender Prozess beide Aufgaben leicht in lokale Minima. In diesem Artikel führen wir erstmals eine Multi-Task-Lernstrategie ein, um schwach überwachte Objektdetektion und Segmentierung zu verbinden, wobei ihre jeweiligen Fehlermuster gegenseitig ergänzen und somit das Lernen beider Aufgaben verbessern. Diese über-Aufgabe-Verstärkung ermöglicht es beiden Aufgaben, aus ihren jeweiligen lokalen Minima auszubrechen. Insbesondere präsentieren wir einen effizienten und leistungsfähigen Rahmen namens Weakly Supervised Joint Detection and Segmentation (WS-JDS). WS-JDS verfügt über zwei Zweige für die beiden genannten Aufgaben, die jeweils denselben Backbone-Netzwerk verwenden. Im Lernprozess wird dasselbe zyklische Trainingsparadigma angewandt, jedoch mit einer spezifischen Verlustfunktion, sodass die beiden Zweige sich gegenseitig unterstützen. Umfangreiche Experimente wurden auf den weit verbreiteten Benchmarks Pascal VOC und COCO durchgeführt, die belegen, dass unser Modell eine konkurrenzfähige Leistung im Vergleich zu den aktuellen State-of-the-Art-Algorithmen erzielt.