Schmetterling: Ein einstufiger Ansatz für weitgehend unsupervises Domänenadaptierung

Im Bereich der unüberwachten Domänenanpassung (UDA) werden Klassifizierer für das Zielgebiet (TD) mit sauber beschrifteten Daten aus dem Quellgebiet (SD) und nicht beschrifteten Daten aus TD trainiert. Allerdings ist es in der Praxis schwierig, bei begrenztem Budget eine große Menge von perfekt sauberen beschrifteten Daten im SD zu erlangen. Daher betrachten wir ein neues, realistischeres und anspruchsvolleres Problemsetting, bei dem Klassifizierer mit verrauschten beschrifteten Daten aus SD und nicht beschrifteten Daten aus TD trainiert werden müssen – wir nennen dies wildly UDA (WUDA). Wir zeigen, dass WUDA alle UDA-Methoden zerstört, wenn die Beschriftungsrauschen im SD nicht berücksichtigt werden, und zu diesem Zweck schlagen wir den Butterfly-Framework vor, eine leistungsfähige und effiziente Lösung für WUDA. Butterfly unterhält gleichzeitig vier Deep-Networks, wovon zwei sich um alle Anpassungen kümmern (d.h., verratete-zu-saubere, beschriftete-zu-nicht-beschriftete und SD-zu-TD-verteilungsbezogene Anpassungen), sodass die anderen beiden sich auf die Klassifikation im TD konzentrieren können. Folglich verfügt Butterfly über alle konzeptionell notwendigen Komponenten zur Lösung von WUDA. Experimente belegen, dass Butterfly unter WUDA signifikant besser abschneidet als existierende Baseline-Methoden.