Analyse et amélioration de la qualité d’image de StyleGAN

L’architecture GAN à style (StyleGAN) obtient des résultats de pointe dans le domaine de la modélisation d’images génératives non conditionnelles fondée sur les données. Nous mettons en évidence et analysons plusieurs artefacts caractéristiques de ce modèle, et proposons des modifications tant au niveau de l’architecture que des méthodes d’entraînement pour y remédier. En particulier, nous redéfinissons la normalisation du générateur, revisitons la croissance progressive, et régularisons le générateur afin d’encourager une bonne conditionnement de l’application des codes latents vers les images. Outre l’amélioration de la qualité des images, ce régulariseur de longueur de parcours présente l’avantage supplémentaire de rendre le générateur significativement plus facile à inverser. Cela permet d’attribuer de manière fiable une image générée à un réseau spécifique. Nous visualisons également la manière dont le générateur exploite sa résolution de sortie, et identifions un problème de capacité, ce qui nous incite à entraîner des modèles plus grands afin d’obtenir des améliorations supplémentaires de qualité. Globalement, notre modèle amélioré redéfinit l’état de l’art dans la modélisation d’images non conditionnelles, tant en termes de métriques existantes de qualité de distribution qu’en termes de qualité perçue des images.