Semisupervised Semantic Segmentation mit Error Localization Network

Diese Arbeit untersucht das semi-supervised Lernen der semantischen Segmentierung, bei dem angenommen wird, dass nur ein kleiner Teil der Trainingsbilder beschriftet ist, während die übrigen Bilder unbeschriftet bleiben. Die unbeschrifteten Bilder werden gewöhnlich mit Pseudolabels versehen, um im Trainingsprozess verwendet zu werden – was jedoch oft das Risiko einer Leistungsverschlechterung durch Bestätigungsfehler bezüglich dieser Pseudolabels birgt. Wir präsentieren eine neuartige Methode, die dieses chronische Problem der Pseudolabeling löst. Im Kern unserer Methode steht das Error Localization Network (ELN), ein Hilfsmodul, das ein Bild und seine Segmentierungsvorhersage als Eingabe erhält und Pixel identifiziert, deren Pseudolabels wahrscheinlich falsch sind. Durch die Ignorierung von Label-Rauschen während des Trainings ermöglicht das ELN ein robustes semi-supervised Lernen gegenüber ungenauen Pseudolabels und lässt sich nahtlos mit Self-Training und Contrastive Learning integrieren. Darüber hinaus führen wir eine neue Lernstrategie für das ELN ein, die während des Trainings plausibel und vielfältige Segmentierungsfehler simuliert, um dessen Generalisierungsfähigkeit zu verbessern. Unsere Methode wird auf PASCAL VOC 2012 und Cityscapes evaluiert, wo sie in jeder Bewertungssituation alle bestehenden Ansätze übertrifft.