Lernen der Erkennung offener Klassen für universelle Domänenanpassung

Universelle Domänenanpassung (Universal Domain Adaptation, UDA) überträgt Wissen zwischen Domänen, ohne Einschränkungen hinsichtlich der Labelmengen zu erfordern, und erweitert damit die Anwendbarkeit der Domänenanpassung in realen, offenen Szenarien. Bei UDA können sowohl die Quell- als auch die Ziel-Domäne jeweils individuelle Labels enthalten, die nicht in der anderen Domäne vorkommen. Eine zentrale, de facto Herausforderung der UDA besteht darin, die Zielbeispiele in den gemeinsamen Klassen unter Berücksichtigung des Domänenverschiebungsproblems korrekt zu klassifizieren. Eine weitere, besonders herausfordernde Aufgabe ist die Erkennung von Zielbeispielen, die zu den im Zielbereich individuellen Labels (sogenannten „offenen Klassen“) gehören, und diese als „unbekannt“ zu markieren. Diese beiden miteinander verflochtenen Herausforderungen machen die UDA zu einem bisher stark unterschätzten und wenig erforschten Problem. Bisherige Ansätze zur UDA konzentrieren sich hauptsächlich auf die Klassifikation von Daten in den gemeinsamen Klassen und verwenden die pro-Klassen-Accuracy als Bewertungsmetrik – eine Metrik, die stark gegenüber der Genauigkeit der gemeinsamen Klassen verzerrt ist. Die präzise Erkennung offener Klassen ist jedoch die entscheidende Aufgabe, um eine echte universelle Domänenanpassung zu ermöglichen. Eine solche Erkennung transformiert das UDA-Problem zudem in ein gut etabliertes, geschlossenes Domänenanpassungsproblem. Um eine präzise Erkennung offener Klassen zu erreichen, schlagen wir CMU (Calibrated Multiple Uncertainties) vor, eine Methode mit einer neuartigen Übertragbarkeitsmaßnahme, die auf einer Mischung verschiedener Unsicherheitsmaße – Entropie, Konfidenz und Konsistenz – basiert und auf bedingten Wahrscheinlichkeiten beruht, die durch ein Ensemble aus mehreren Klassifizierern kalibriert wurden. Diese neue Übertragbarkeitsmaßnahme quantifiziert präzise die Neigung eines Zielbeispiels, einer offenen Klasse zuzuordnen. Außerdem führen wir eine neuartige Bewertungsmetrik namens H-Score ein, die die Bedeutung sowohl der Genauigkeit der gemeinsamen Klassen als auch der „unbekannten“ Klasse hervorhebt. Empirische Ergebnisse im Rahmen der UDA-Szenarien zeigen, dass CMU die bisher besten Methoden der Domänenanpassung in allen Bewertungskriterien übertrifft, insbesondere mit einem erheblichen Vorsprung beim H-Score.