InfinityGAN : Vers la synthèse d'images à résolution infinie

Nous présentons un cadre novateur, InfinityGAN, pour la génération d’images de taille arbitraire. Cette tâche est associée à plusieurs défis majeurs. Premièrement, l’extension des modèles existants à des tailles d’image arbitrairement grandes est limitée par des contraintes de ressources, tant en termes de calcul que d’accès à des données d’entraînement à large champ de vision. InfinityGAN effectue l’entraînement et la génération de manière continue, patch par patch, avec des ressources computationnelles faibles. Deuxièmement, les images de grande taille doivent être cohérentes à la fois localement et globalement, éviter les motifs répétitifs et paraître réalistes. Pour relever ces défis, InfinityGAN découple les apparences globales, les structures locales et les textures. Grâce à cette formulation, nous pouvons générer des images dont la taille spatiale et le niveau de détail dépassent ce qui était auparavant réalisable. Une évaluation expérimentale confirme que InfinityGAN produit des images aux réalismes supérieurs par rapport aux méthodes de référence, tout en offrant une inférence parallélisable. Enfin, nous illustrons plusieurs applications rendues possibles par notre approche, telles que la fusion de styles spatiaux, l’outpainting multi-modale et l’interpolation d’images. Toutes ces applications peuvent être exécutées avec des tailles d’entrée et de sortie arbitraires. Pour consulter la version complète de l’article, veuillez vous rendre à l’adresse suivante : https://openreview.net/forum?id=ufGMqIM0a4b.