UMAD : Adaptation universelle des modèles sous décalage de domaine et de catégorie

Apprendre à rejeter les échantillons inconnus (absents des classes sources) dans le domaine cible est particulièrement important pour l’adaptation de domaine non supervisée (UDA). Deux scénarios typiques d’UDA existent : le scénario « open-set » et le scénario « open-partial-set », le second supposant que toutes les classes sources ne sont pas présentes dans le domaine cible. Toutefois, la plupart des méthodes précédentes sont conçues pour un seul scénario d’UDA et se comportent médiocrement dans l’autre. De plus, elles nécessitent l’accès aux données sources étiquetées pendant l’adaptation, ce qui limite leur utilisation dans des applications sensibles à la confidentialité des données. Pour relever ces défis, cet article propose un cadre universel d’adaptation de modèle, appelé UMAD (Universal Model ADaptation), capable de traiter les deux scénarios d’UDA sans accès aux données sources ni connaissance a priori du décalage de catégories entre domaines. Plus précisément, nous visons à apprendre un modèle source à l’aide d’un classificateur à deux têtes soigneusement conçu, que nous transférons au domaine cible. Lors de l’adaptation, nous proposons un score de cohérence informatif afin de distinguer efficacement les échantillons inconnus des échantillons connus. Pour assurer une adaptation bilatérale dans le domaine cible, nous maximisons par la suite l’information mutuelle localisée afin d’aligner les échantillons connus sur le classificateur source, tout en appliquant une perte entropique pour repousser les échantillons inconnus loin de la frontière de décision du classificateur source. Des expériences menées sur les scénarios d’UDA « open-set » et « open-partial-set » montrent que UMAD, en tant qu’approche unifiée ne nécessitant pas d’accès aux données sources, atteint des performances comparables, voire supérieures, à celles des méthodes les plus avancées dépendantes des données.