HyperAIHyperAI
vor 2 Monaten

Minimale Klassenverwirrung für vielseitige Domänenanpassung

Ying Jin; Ximei Wang; Mingsheng Long; Jianmin Wang
Minimale Klassenverwirrung für vielseitige Domänenanpassung
Abstract

Es gibt eine Vielzahl von Szenarien der Domänenanpassung (Domain Adaptation, DA), die sich auf Labelmengen und Domänenkonfigurationen beziehen, darunter geschlossene und teilweise Mengen von DA sowie mehrere Quellen- und Ziel-Domänen-DA. Es ist bemerkenswert, dass bestehende DA-Methoden in der Regel nur für ein spezifisches Szenario entwickelt sind und möglicherweise in Szenarien, für die sie nicht optimiert wurden, unterdurchschnittliche Leistungen erzielen. In diesem Kontext untersucht dieser Artikel die flexible Domänenanpassung (Versatile Domain Adaptation, VDA), bei der eine Methode mehrere verschiedene DA-Szenarien ohne jede Modifikation bewältigen kann. Um dieses Ziel zu erreichen, sollte ein allgemeinerer induktiver Bias als die Domänenanpassung erforscht werden. Wir gehen auf ein fehlendes Element bestehender Methoden ein: Klassenverwirrung, die Tendenz eines Klassifikators, Vorhersagen zwischen den korrekten und ambigen Klassen für Zielbeispiele zu verwechseln, was in verschiedenen DA-Szenarien häufig vorkommt. Wir zeigen auf, dass das Reduzieren solcher paarweiser Klassenverwirrung zu erheblichen Transfergewinnen führt. Aufgrund dieses Erkenntnisses schlagen wir eine allgemeine Verlustfunktion vor: Minimale Klassenverwirrung (Minimum Class Confusion, MCC). Diese kann charakterisiert werden als (1) eine nicht-antagonistische DA-Methode ohne explizite Anwendung der Domänenanpassung, wodurch eine schnellere Konvergenzgeschwindigkeit erreicht wird; (2) einen flexiblen Ansatz, der vier bestehende Szenarien bewältigen kann: Geschlossene Mengen (Closed-Set), Teilmenge (Partial-Set), Mehrfachquelle (Multi-Source) und Mehrfachziel (Multi-Target) DA. Sie übertrifft dabei die bislang besten Methoden in diesen Szenarien, insbesondere auf einem der größten und schwierigsten Datensätze bis dato (7,3 % auf DomainNet). Ihre Flexibilität wird durch zwei in diesem Artikel vorgeschlagene Szenarien weiter gerechtfertigt: Mehrfachquelle Teilmenge DA und Mehrfachziel Teilmenge DA. Darüber hinaus kann sie auch als allgemeiner Regularisierer verwendet werden, der orthogonal und komplementär zu einer Vielzahl von bestehenden DA-Methoden ist und deren Konvergenz beschleunigt sowie diese bereits wettbewerbsfähigen Methoden zu stärkeren macht. Der Code ist unter https://github.com/thuml/Versatile-Domain-Adaptation verfügbar.

Minimale Klassenverwirrung für vielseitige Domänenanpassung | Neueste Forschungsarbeiten | HyperAI