DRANet : Réseaux de représentation et d’adaptation désenchevêtrés pour l’adaptation de domaine non supervisée

Dans cet article, nous présentons DRANet, une architecture de réseau qui désentrelace les représentations d’images et transfère les attributs visuels dans un espace latent pour une adaptation de domaine non supervisée. Contrairement aux méthodes existantes d’adaptation de domaine qui apprennent des caractéristiques associées partagées entre les domaines, DRANet préserve l’originalité des caractéristiques propres à chaque domaine. Notre modèle encode séparément les représentations du contenu (structure de la scène) et du style (apparence artistique) à partir d’images sources et cibles. Ensuite, il adapte le domaine en intégrant le facteur de style transféré au facteur de contenu, accompagné de poids apprenables spécifiques à chaque domaine. Ce cadre d’apprentissage permet une adaptation de domaine bi- ou multi-directionnelle à l’aide d’un unique réseau encodeur-décodeur, tout en alignant le décalage entre domaines. Par ailleurs, nous proposons un module de transfert de domaine adaptatif au contenu, qui permet de préserver la structure de la scène tout en transférant le style. Des expériences étendues montrent que notre modèle parvient efficacement à séparer les facteurs contenu-style et à synthétiser des images transférées de domaine visuellement plaisantes. La méthode proposée atteint des performances de pointe sur des tâches standard de classification de chiffres ainsi que sur des tâches de segmentation sémantique.