Grenzeneffektive Co-Training für schwach überwachte semantische Segmentierung

Bestehende schwach überwachte semantische Segmentierungsmethoden (WSSS) legen großen Wert auf die Erzeugung genauer und vollständiger Klassifikationsaktivierungskarten (CAMs) als Pseudolabels, während die Bedeutung des Trainings der Segmentierungsnetzwerke vernachlässigt wird. In dieser Arbeit beobachten wir eine Diskrepanz zwischen der Qualität der Pseudolabels in den CAMs und der Leistung des finalen Segmentierungsmodells, wobei die falsch klassifizierten Pixel hauptsächlich in Randbereichen liegen. Ausgehend von diesen Erkenntnissen argumentieren wir, dass der Fokus von WSSS auf ein robusteres Lernen unter Berücksichtigung verrauschter Pseudolabels verlegt werden sollte, und schlagen hierfür eine neue Methode namens boundary-enhanced co-training (BECO) zur Modelltrainierung vor. Konkret schlagen wir zunächst ein Co-Training-Paradigma mit zwei interaktiven Netzwerken vor, um das Lernen unsicherer Pixel zu verbessern. Anschließend führen wir eine randverstärkte Strategie ein, die die Vorhersage schwieriger Randbereiche steigert und dabei zuverlässige Vorhersagen nutzt, um künstliche Ränder zu konstruieren. Durch die Kombination des Co-Training-Ansatzes und der randverstärkten Strategie erreicht unsere Methode eine vielversprechende Segmentierungsgenauigkeit unabhängig von der Qualität der Ausgangs-CAMs. Umfassende Experimente auf den Datensätzen PASCAL VOC 2012 und MS COCO 2014 bestätigen die Überlegenheit unserer BECO-Methode gegenüber anderen state-of-the-art-Verfahren.