Selbstüberwachte Augmentierungs-Konsistenz zur Anpassung der semantischen Segmentierung

Wir schlagen einen Ansatz für die Domänenanpassung bei der semantischen Segmentierung vor, der sowohl praktisch als auch äußerst genau ist. Im Gegensatz zu früheren Arbeiten verzichten wir auf rechenintensive adversarielle Ziele, Netzwerk-Ensembles und Stiltransfer. Stattdessen nutzen wir herkömmliche Datenverstärkungstechniken – photometrischen Rauschen, Spiegelung und Skalierung – und gewährleisten die Konsistenz der semantischen Vorhersagen über diese Bildtransformationen hinweg. Wir entwickeln dieses Prinzip in einem leichtgewichtigen, selbstüberwachten Framework, das auf ko-evolvierenden Pseudolabels trainiert wird, ohne zusätzliche, aufwändige Trainingsrunden zu erfordern. Einfach im Training aus der Sicht eines Praktikers, ist unser Ansatz bemerkenswert wirksam. Wir erreichen signifikante Verbesserungen der aktuellen State-of-the-Art-Genauigkeit bei der Segmentierung nach der Anpassung, die sowohl bezüglich verschiedener Backbone-Architekturen als auch unterschiedlicher Anpassungsszenarien konsistent sind.