HyperAIHyperAI
il y a 11 jours

Adaptation de domaine non supervisée par clustering discriminatif distillé

Hui Tang, Yaowei Wang, Kui Jia
Adaptation de domaine non supervisée par clustering discriminatif distillé
Résumé

L’adaptation de domaine non supervisée s’attaque au problème de classification des données dans un domaine cible non étiqueté, en s’appuyant sur des données étiquetées provenant d’un domaine source partageant un espace d’étiquettes commun mais suivant une distribution différente. La plupart des méthodes récentes adoptent une approche consistant à aligner explicitement les distributions de caractéristiques entre les deux domaines. À l’inverse, motivés par l’hypothèse fondamentale de l’adaptabilité de domaine, nous reformulons le problème d’adaptation de domaine comme un regroupement discriminant des données cibles, en exploitant une information privilégiée puissante fournie par les données source étiquetées, étroitement liées au domaine cible. Techniquement, nous utilisons des objectifs de regroupement fondés sur une variante robuste de la minimisation de l’entropie, qui filtre de manière adaptative les données cibles, un critère de type Fisher doux, ainsi qu’un classement des clusters basé sur la classification des centroïdes. Pour extraire efficacement des informations discriminantes provenant du domaine source afin de guider le regroupement des données cibles, nous proposons d’entraîner en parallèle le réseau à l’aide d’objectifs supervisés sur les données source étiquetées. Nous appelons notre méthode de regroupement discriminant dérivé pour l’adaptation de domaine DisClusterDA. Nous fournissons également une intuition géométrique illustrant comment les différents objectifs constitutifs de DisClusterDA contribuent à apprendre des distributions de caractéristiques compactes et pures par classe. Des études d’ablation soigneuses ainsi que des expériences étendues sur cinq jeux de données standards populaires, incluant un cas d’adaptation de domaine multi-source, sont menées. Sur la base de réseaux de base couramment utilisés, DisClusterDA surpasse les méthodes existantes sur ces benchmarks. Il est également intéressant de noter que, dans notre cadre DisClusterDA, l’ajout d’un terme supplémentaire de perte visant explicitement à aligner les distributions de caractéristiques au niveau des classes entre les domaines se révèle néfaste pour la performance d’adaptation, bien que des études plus approfondies dans différents cadres algorithmiques soient nécessaires.

Adaptation de domaine non supervisée par clustering discriminatif distillé | Articles de recherche récents | HyperAI