Unüberwachte Domänenanpassung durch verdichtete diskriminative Clusterung

Unsupervised Domain Adaptation adressiert das Problem der Klassifikation von Daten in einem unlabeled Target-Domain, gegeben gelabelte Quelldaten aus einer gemeinsamen Label-Struktur, die jedoch eine unterschiedliche Verteilung aufweisen. Die meisten aktuellen Methoden verfolgen einen Ansatz, bei dem die Merkmalsverteilungen zwischen den beiden Domänen explizit ausgerichtet werden. Im Gegensatz dazu formulieren wir das Domain-Adaptationsproblem aufgrund der grundlegenden Annahme der Domänenübertragbarkeit neu als diskriminative Clustering der Target-Daten, unter Verwendung starker privilegierter Informationen, die durch die eng verwandten, gelabelten Quelldaten bereitgestellt werden. Technisch nutzen wir Clustering-Ziele basierend auf einer robusten Variante der Entropie-Minimierung, die Ziel-Daten adaptiv filtert, ein weiches Fisher-ähnliches Kriterium sowie zusätzlich die Cluster-Ordnung durch Zentroid-Klassifikation. Um diskriminative Quellinformationen für das Target-Clustering zu extrahieren, schlagen wir vor, das Netzwerk gemeinsam mit parallelen, überwachten Lernzielen auf den gelabelten Quelldaten zu trainieren. Wir bezeichnen unsere Methode des abgeleiteten diskriminativen Clustering für Domain Adaptation als DisClusterDA. Wir liefern außerdem eine geometrische Intuition, die verdeutlicht, wie die einzelnen Komponenten von DisClusterDA dazu beitragen, klassenweise reine und kompakte Merkmalsverteilungen zu lernen. Wir führen sorgfältige Ablationsstudien und umfangreiche Experimente auf fünf gängigen Benchmark-Datensätzen durch, darunter ein Multi-Source-Domain-Adaptation-Datensatz. Unter Verwendung gängiger Backbone-Netzwerke übertrifft DisClusterDA bestehende Methoden auf diesen Benchmarks. Interessanterweise zeigt sich in unserem DisClusterDA-Framework, dass die Hinzufügung eines zusätzlichen Verlustterms, der explizit darauf abzielt, die klassenbasierten Merkmalsverteilungen über die Domänen hinweg auszurichten, die Adaptationsleistung beeinträchtigt – obwohl weitere sorgfältigere Untersuchungen in unterschiedlichen algorithmischen Rahmenwerken erforderlich sind.