Alles über Struktur: Anpassung von strukturellen Informationen über Bereiche hinweg zur Verbesserung der semantischen Segmentierung

In dieser Arbeit adressieren wir das Problem der unüberwachten Domänenanpassung für die Aufgabe der semantischen Segmentierung, bei der wir versuchen, das auf synthetischen Datensätzen mit Ground-Truth-Labels erlernte Wissen auf realweltliche Bilder ohne jegliche Annotation zu übertragen. Unter der Hypothese, dass der strukturelle Inhalt von Bildern der entscheidendste und informativste Faktor für die semantische Segmentierung ist und leicht über verschiedene Domänen hinweg geteilt werden kann, schlagen wir ein Framework zur domäneninvarianten Strukturextraktion (DISE) vor. Dieses Framework trennt Bilder in domäneninvariante Struktur- und domänenspezifische Texturrepräsentationen, was es ermöglicht, Bildübersetzungen zwischen verschiedenen Domänen durchzuführen und Labeltransfer zu realisieren, um die Segmentationsleistung zu verbessern. Ausführliche Experimente bestätigen die Effektivität unseres vorgeschlagenen DISE-Modells und zeigen seine Überlegenheit gegenüber mehreren Stand-of-the-Art-Ansätzen.