
Dans cet article, nous décrivons le « PixelGAN autoencoder », un autoencodeur génératif dans lequel la voie générative est un réseau neuronal autorégressif convolutif sur les pixels (PixelCNN) conditionné par un code latent, et la voie de reconnaissance utilise un réseau antagoniste génératif (GAN) pour imposer une distribution a priori sur ce code latent. Nous montrons que différentes distributions a priori entraînent des décompositions différentes de l'information entre le code latent et le décodeur autorégressif. Par exemple, en imposant une distribution gaussienne comme distribution a priori, nous pouvons obtenir une décomposition globale versus locale, ou en imposant une distribution catégorielle comme distribution a priori, nous pouvons dissocier l'information de style et de contenu des images d'une manière non supervisée. Nous montrons également comment le PixelGAN autoencoder avec une distribution catégorielle peut être utilisé directement dans des contextes semi-supervisés et obtenir des résultats de classification semi-supervisée compétitifs sur les jeux de données MNIST, SVHN et NORB.