Selektive partielle Domänenanpassung

Partielle Domänenanpassung (Partial Domain Adaptation, PDA), bei der angenommen wird, dass der Labelraum der Ziel-Domäne eine Teilmenge des Labelraums der Quell-Domäne ist, hat in den letzten Jahren erhebliche Aufmerksamkeit erhalten. Aufgrund der Unterschiede im Labelraum beider Domänen ist eine direkte Ausrichtung dieser beiden Domänen in PDA besonders herausfordernd. Um dieses Problem zu bewältigen, schlagen wir eine selektive partielle Domänenanpassungsmethode (Selective Partial Domain Adaptation, SPDA) vor, die nützliche Daten zur Anpassung an die Ziel-Domäne auswählt. Konkret entwerfen wir zunächst eine auf PDA zugeschnittene Ähnlichkeitsfunktion basierend auf dem Maximum der Cosinus-Ähnlichkeit (Maximum of Cosine, MoC), um nützliche Daten aus der Quell-Domäne auszuwählen und die Domänenabweichung zu verringern. In der MoC-Ähnlichkeitsfunktion wählt man für jedes Ziel-Domänen-Beispiel das Quell-Domänen-Beispiel mit der maximalen Cosinus-Ähnlichkeit zur Anpassung aus. Darüber hinaus wird ein selektiver Trainingsansatz entworfen, um nützliche Ziel-Domänen-Daten in die Quell-Domäne einzufügen. Genauer gesagt, weist der selektive Trainingsansatz zunächst Ziel-Domänen-Beispiele mittels eines Selbst-Training-Strategie Pseudolabels zu und integriert anschließend jene Ziel-Domänen-Beispiele, die eine hohe Zuverlässigkeit bezüglich ihrer Pseudolabels aufweisen, in die Quell-Domäne. Auf Basis dieser beiden Selektionsoperationen kann die vorgeschlagene SPDA-Methode effektiv nützliche Daten für die Domänenanpassung auswählen. Experimente an mehreren Datensätzen belegen die Wirksamkeit der vorgeschlagenen SPDA-Methode.