Apprentissage de la traduction d’images d’un domaine à un autre non supervisée en utilisant un discriminateur partagé

La translation non supervisée d’images à images vise à transformer des images provenant d’un domaine source afin de générer des images appartenant à un domaine cible, sans recourir à des paires d’images source-cible. Des résultats prometteurs ont été obtenus pour ce problème dans un cadre adversarial utilisant deux GANs indépendants et des mécanismes d’attention. Nous proposons une nouvelle méthode qui met en œuvre un seul discriminateur partagé entre les deux GANs, ce qui améliore l’efficacité globale. Nous évaluons les résultats qualitatifs et quantitatifs sur une tâche de transformation d’images, une translation entre domaines croisés, dans un contexte où le domaine cible partage des sémantiques similaires avec le domaine source. Nos résultats montrent que, même en l’absence de mécanismes d’attention, notre méthode atteint des performances équivalentes à celles des méthodes basées sur l’attention, tout en générant des images de qualité comparable.