Extension progressive du domaine source pour l'adaptation de domaine non supervisée

L’adaptation de domaine non supervisée (UDA) vise à réduire la dépendance vis-à-vis d’un grand jeu de données étiqueté en transférant des connaissances depuis un jeu de données source, richement étiqueté, vers un jeu de données cible, qui ne contient aucune étiquette. En l’absence d’étiquettes dans le domaine cible, une mauvaise alignement précoce peut se propager aux étapes ultérieures, entraînant une accumulation d’erreurs. Pour surmonter ce problème, nous proposons un algorithme d’expansion progressive du domaine source, appelé GSDE (Gradual Source Domain Expansion). Le GSDE entraîne la tâche UDA plusieurs fois de zéro, en réinitialisant à chaque fois les poids du réseau, tout en élargissant progressivement le jeu de données source en y intégrant des données cibles. Plus précisément, les échantillons cibles ayant les scores les plus élevés lors de l’exécution précédente sont utilisés comme échantillons pseudo-source, munis de leurs pseudo-étiquettes correspondantes. Grâce à cette stratégie, les échantillons pseudo-source transmettent directement les connaissances extraites de l’itération précédente dès le début de l’entraînement suivant. Cela favorise une meilleure alignement entre les deux domaines, en particulier durant les premières phases d’entraînement. Dans cette étude, nous introduisons d’abord un réseau de base performant, auquel nous appliquons notre stratégie GSDE. Nous menons des expériences et des études d’ablation sur trois benchmarks (Office-31, OfficeHome et DomainNet), où notre méthode surpasser les approches de pointe. Nous démontrons également que la stratégie GSDE proposée peut améliorer la précision de diverses approches UDA de pointe différentes.