Pixelbasierte kontrastive-konsistente semi-supervised semantische Segmentierung

Wir präsentieren eine neuartige semi-supervised semantische Segmentierungsmethode, die zwei gewünschte Eigenschaften von Segmentierungsmodellen gleichzeitig erreicht: die Konsistenz im Label-Raum zwischen Bildaugmentierungen und die kontrastive Eigenschaft im Merkmalsraum zwischen verschiedenen Pixeln. Hierzu nutzen wir jeweils die pixelbasierte L2-Verlustfunktion und den pixelbasierten kontrastiven Verlust. Um die Probleme der Recheneffizienz und der falsch positiven Rauschquellen, die mit dem pixelbasierten kontrastiven Verlust verbunden sind, zu adressieren, führen wir zudem mehrere negative Sampling-Techniken ein und untersuchen deren Wirkung. Umfangreiche Experimente belegen die state-of-the-art-Leistung unserer Methode (PC2Seg) im Rahmen der DeepLab-v3+-Architektur in mehreren anspruchsvollen semi-supervised Szenarien, die aus den Datensätzen VOC, Cityscapes und COCO abgeleitet wurden.