Amélioration des techniques d'entraînement des GANs

Nous présentons une variété de nouvelles caractéristiques architecturales et de procédures d'entraînement que nous appliquons au cadre des réseaux de neurones génératifs adverses (GANs). Nous nous concentrons sur deux applications des GANs : l'apprentissage semi-supervisé et la génération d'images que les humains trouvent visuellement réalistes. Contrairement à la plupart des travaux sur les modèles génératifs, notre objectif principal n'est pas d'entraîner un modèle qui attribue une forte probabilité aux données de test, ni de nécessiter que le modèle puisse apprendre efficacement sans utiliser aucune étiquette. En utilisant nos nouvelles techniques, nous obtenons des résultats de pointe en classification semi-supervisée sur MNIST, CIFAR-10 et SVHN. Les images générées sont de haute qualité, comme le confirme un test visuel de Turing : notre modèle génère des échantillons MNIST que les humains ne peuvent pas distinguer des données réelles, ainsi que des échantillons CIFAR-10 qui entraînent une erreur humaine de 21,3 %. Nous présentons également des échantillons ImageNet avec une résolution sans précédent et montrons que nos méthodes permettent au modèle d'apprendre des caractéristiques reconnaissables des classes ImageNet.