Unüberwachte Domänenanpassung mittels strukturierter Vorhersage basierter selektiver Pseudo-Labeling

Unsupervised Domain Adaptation zielt darauf ab, das Problem der Klassifikation von unlabeled Sample aus dem Zielbereich zu lösen, während nur gelabelte Daten aus dem Quellbereich verfügbar sind und die Datensverteilungen in beiden Bereichen unterschiedlich sind. Dadurch leidet die Leistung von Klassifikatoren, die auf gelabelten Daten aus dem Quellbereich trainiert wurden, erheblich, wenn sie direkt auf die Daten aus dem Zielbereich angewendet werden. Um dieses Problem anzugehen, wurden verschiedene Ansätze vorgeschlagen, um domain-invariante Merkmale oder domain-spezifische Klassifikatoren zu lernen. In beiden Fällen kann jedoch die fehlende Labelung der Daten im Zielbereich ein Problem darstellen, das typischerweise durch Pseudolabeling überwunden wird. Ungenaues Pseudolabeling kann jedoch zu einer katastrophalen Akkumulation von Fehlern während des Lernprozesses führen. In diesem Paper stellen wir eine neuartige selektive Pseudolabeling-Strategie vor, die auf strukturierter Vorhersage basiert. Die Idee der strukturierten Vorhersage wird durch die Beobachtung motiviert, dass die Samples im Zielbereich im tiefen Merkmalsraum gut gruppiert sind, sodass eine unsupervisierte Clustering-Analyse zur Unterstützung einer genauen Pseudolabeling genutzt werden kann. Experimentelle Ergebnisse auf vier Datensätzen (nämlich Office-Caltech, Office31, ImageCLEF-DA und Office-Home) bestätigen, dass unsere Methode gegenwärtige state-of-the-art-Methoden übertrifft.