StarGAN : Réseaux de Génération Adversariaux Unifiés pour la Traduction d'Images Inter-domaines Multiple

Des études récentes ont montré des succès remarquables dans la traduction d'images entre deux domaines. Cependant, les approches existantes présentent une scalabilité et une robustesse limitées lorsqu'il s'agit de gérer plus de deux domaines, car différents modèles doivent être construits indépendamment pour chaque paire de domaines d'images. Pour remédier à cette limitation, nous proposons StarGAN, une nouvelle approche scalable qui peut effectuer des traductions d'images entre plusieurs domaines en utilisant un seul modèle. Une telle architecture de modèle unifié de StarGAN permet l'entraînement simultané de multiples jeux de données avec différents domaines au sein d'un seul réseau. Cela conduit à une qualité supérieure des images traduites par StarGAN par rapport aux modèles existants ainsi qu'à la capacité novatrice de traduire une image d'entrée vers n'importe quel domaine cible souhaité. Nous démontrons empiriquement l'efficacité de notre approche sur des tâches de transfert d'attributs faciaux et de synthèse d'expressions faciales.