Puissances des couches pour la translation image à image

Nous proposons une architecture simple pour traiter les tâches de translation image à image non appariées : transfert de style ou de classe, débruitage, déflouage, suppression des artefacts de blocage, etc. Nous partons d'une architecture d'autoencodeur d'image à poids fixes. Pour chaque tâche, nous apprenons un bloc résiduel agissant dans l'espace latent, qui est itérativement appliqué jusqu'à atteindre le domaine cible. Une stratégie d'entraînement spécifique est nécessaire afin de réduire l'effet exponentiel accumulé par les itérations. En phase de test, cette approche présente plusieurs avantages : le nombre de paramètres pondérés est limité, et la conception compositionnelle permet de réguler l'intensité de la transformation en fonction du nombre d'itérations. Ceci est particulièrement utile, par exemple, lorsque le type ou la quantité de bruit à supprimer n'est pas connu à l'avance. Expérimentalement, nous fournissons des preuves de concept démontrant l'intérêt de notre méthode pour de nombreuses transformations. Les performances de notre modèle sont comparables ou supérieures à celles de CycleGAN, tout en utilisant significativement moins de paramètres.