cGANs avec Discriminateur de Projection

Nous proposons une nouvelle méthode basée sur la projection pour intégrer les informations conditionnelles dans le discriminateur des GANs, en respectant le rôle de ces informations dans le modèle probabiliste sous-jacent. Cette approche contraste avec la plupart des cadres de GANs conditionnels utilisés aujourd'hui, qui intègrent les informations conditionnelles en concaténant le vecteur conditionnel (embeddé) aux vecteurs de caractéristiques. Grâce à cette modification, nous avons réussi à améliorer considérablement la qualité de la génération d'images conditionnelle par classe sur l'ensemble de données d'images ILSVRC2012 (ImageNet) à 1000 classes, dépassant ainsi les résultats actuels de l'état de l'art, et ce avec un seul couple de discriminateur et générateur. Nous avons également étendu cette application au suréchantillonnage et réussi à produire des images de suréchantillonnage hautement discriminantes. Cette nouvelle structure a également permis des transformations catégorielles de haute qualité basées sur la transformation fonctionnelle paramétrique des couches de normalisation par lots conditionnelles dans le générateur.