Papillon : Une approche en une étape vers l'adaptation de domaine non supervisée à grande échelle

Dans l'adaptation de domaine non supervisée (UDA), les classifieurs pour le domaine cible (TD) sont formés à l'aide de données étiquetées propres provenant du domaine source (SD) et de données non étiquetées provenant du TD. Cependant, dans des conditions réelles, il est difficile d'acquérir une grande quantité de données étiquetées parfaitement propres dans le SD en raison d'un budget limité. Par conséquent, nous considérons un nouveau cadre de problème plus réaliste et plus complexe, où les classifieurs doivent être formés avec des données étiquetées bruyantes provenant du SD et des données non étiquetées provenant du TD -- nous l'appelons UDA sauvage (WUDA). Nous montrons que WUDA dégrade toutes les méthodes UDA si la bruititude des étiquettes dans le SD n'est pas prise en compte, et à cet égard, nous proposons le cadre Butterfly, une solution puissante et efficace à WUDA. Butterfly maintient simultanément quatre réseaux profonds, dont deux s'occupent de toutes les adaptations (c'est-à-dire bruyantes-vers-propres, étiquetées-vers-non-étiquetées, et distributionnelles SD-vers-TD), permettant ainsi aux deux autres de se concentrer sur la classification dans le TD. En conséquence, Butterfly possède tous les composants conceptuellement nécessaires pour résoudre WUDA. Les expériences démontrent que, sous WUDA, Butterfly surpasse significativement les méthodes de base existantes.