Clustering par consensus de domaine pour l'adaptation de domaine universelle

Dans cet article, nous étudions le problème de l’adaptation de domaine universelle (Universal Domain Adaptation, UniDA), qui vise à transférer les connaissances d’un domaine source vers un domaine cible lorsque les espaces de labels ne sont pas alignés. Le défi principal de l’UniDA réside dans la séparation entre les classes communes (c’est-à-dire les classes partagées entre les domaines) et les classes privées (c’est-à-dire les classes présentes uniquement dans un domaine). Les travaux antérieurs traitent les échantillons privés du domaine cible comme une seule classe générique, tout en ignorant leur structure intrinsèque. Par conséquent, les représentations obtenues ne sont pas suffisamment compactes dans l’espace latent et peuvent facilement être confondues avec celles des échantillons communs. Afin d’exploiter de manière plus efficace la structure intrinsèque du domaine cible, nous proposons une méthode appelée Clustering par Consensus de Domaine (Domain Consensus Clustering, DCC), qui exploite les connaissances de consensus entre domaines pour découvrir des clusters discriminants tant sur les échantillons communs que sur les échantillons privés. Plus précisément, nous tirons le consensus de domaine à deux niveaux afin de favoriser le clustering et la découverte des classes privées : d’une part, le consensus au niveau sémantique, qui identifie les clusters cycliquement cohérents comme étant les classes communes ; d’autre part, le consensus au niveau des échantillons, qui utilise l’accord de classification entre domaines pour déterminer le nombre de clusters et découvrir les classes privées. Grâce à DCC, nous parvenons à séparer les classes privées des classes communes, tout en différenciant les classes privées entre elles. Enfin, nous appliquons une technique d’alignement consciente des classes sur les échantillons communs identifiés afin de minimiser le décalage de distribution, ainsi qu’un régulariseur prototypique pour encourager la formation de clusters cibles discriminants. Des expériences menées sur quatre benchmarks montrent que DCC surpasse significativement les méthodes de l’état de l’art précédentes.