HyperAIHyperAI
il y a 17 jours

Puissances des couches pour la translation image à image

Hugo Touvron, Matthijs Douze, Matthieu Cord, Hervé Jégou
Puissances des couches pour la translation image à image
Résumé

Nous proposons une architecture simple pour traiter les tâches de translation image à image non appariées : transfert de style ou de classe, débruitage, déflouage, suppression des artefacts de blocage, etc. Nous partons d'une architecture d'autoencodeur d'image à poids fixes. Pour chaque tâche, nous apprenons un bloc résiduel agissant dans l'espace latent, qui est itérativement appliqué jusqu'à atteindre le domaine cible. Une stratégie d'entraînement spécifique est nécessaire afin de réduire l'effet exponentiel accumulé par les itérations. En phase de test, cette approche présente plusieurs avantages : le nombre de paramètres pondérés est limité, et la conception compositionnelle permet de réguler l'intensité de la transformation en fonction du nombre d'itérations. Ceci est particulièrement utile, par exemple, lorsque le type ou la quantité de bruit à supprimer n'est pas connu à l'avance. Expérimentalement, nous fournissons des preuves de concept démontrant l'intérêt de notre méthode pour de nombreuses transformations. Les performances de notre modèle sont comparables ou supérieures à celles de CycleGAN, tout en utilisant significativement moins de paramètres.

Puissances des couches pour la translation image à image | Articles de recherche récents | HyperAI