vor 17 Tagen

Kategorie-Anchor-gesteuerte unsupervisierte Domänenanpassung für die semantische Segmentierung

Qiming Zhang, Jing Zhang, Wei Liu, Dacheng Tao

Abstract

Unsupervised Domain Adaptation (UDA) zielt darauf ab, die Generalisierungsfähigkeit eines Modells von einer Quell- auf eine Zieldomäne zu verbessern. UDA ist von besonderer Bedeutung, da keine zusätzlichen Anstrengungen zur Annotation von Ziel-Domänen-Proben erforderlich sind. Dennoch beeinträchtigt die unterschiedliche Datenverteilung zwischen den beiden Domänen, auch als \emph{Domain Shift/Discrepancy} bezeichnet, die Leistungsfähigkeit von UDA unweigerlich. Obwohl Fortschritte bei der Anpassung der marginalen Verteilungen zwischen den beiden Domänen erzielt wurden, neigt der Klassifikator dazu, Merkmale der Quell-Domäne zu bevorzugen und falsche Vorhersagen für die Ziel-Domäne zu treffen, da die Merkmalsanpassung kategorieneutral erfolgt. In diesem Paper stellen wir ein neuartiges, kategoriennahe Anker-gesteuertes (CAG) UDA-Modell für die Semantische Segmentierung vor, das explizit eine kategoriensensible Merkmalsanpassung fördert, um gemeinsame, diskriminative Merkmale und Klassifikatoren gleichzeitig zu lernen. Zunächst dienen die kategorienspezifischen Zentroide der Merkmale der Quell-Domäne als geführte Anker, um aktive Merkmale in der Ziel-Domäne zu identifizieren und ihnen pseudo-Labels zuzuweisen. Anschließend nutzen wir eine ankerbasierte pixelweise Distanzverlustfunktion sowie einen diskriminativen Verlust, um die Merkmale innerhalb einer Kategorie näher und die Merkmale zwischen verschiedenen Kategorien weiter auseinander zu bringen. Schließlich entwickeln wir ein stufenweises Trainingsverfahren, um die Akkumulation von Fehlern zu reduzieren und das vorgeschlagene Modell schrittweise anzupassen. Experimente an den Szenarien GTA5$\rightarrow$Cityscapes und SYNTHIA$\rightarrow$Cityscapes zeigen die Überlegenheit unseres CAG-UDA-Modells gegenüber den aktuellen State-of-the-Art-Methoden. Der Quellcode ist unter \url{https://github.com/RogerZhangzz/CAG_UDA} verfügbar.