PixelGAN-Autoencoder

In dieser Arbeit beschreiben wir den „PixelGAN-Autoencoder“, einen generativen Autoencoder, bei dem der generative Pfad ein auf Pixeln basierendes konvolutionsautoregressives neuronales Netzwerk (PixelCNN) ist, das an einem latenten Code konditioniert wird, und der Erkennungspfad ein generatives adversariales Netzwerk (GAN) verwendet, um eine a priori-Verteilung auf den latenten Code aufzulegen. Wir zeigen, dass verschiedene A-Priori-Verteilungen zu unterschiedlichen Zerlegungen der Information zwischen dem latenten Code und dem autoregressiven Decoder führen. Zum Beispiel können wir durch die Auflegung einer Gauß-Verteilung als A-Priori eine globale versus lokale Zerlegung erreichen oder durch die Auflegung einer kategorischen Verteilung als A-Priori die Stil- und Inhaltinformationen von Bildern in einem unüberwachten Modus trennen. Darüber hinaus demonstrieren wir, wie der PixelGAN-Autoencoder mit einem kategorischen A-Priori direkt in halbüberwachten Szenarien eingesetzt werden kann und wettbewerbsfähige halbüberwachte Klassifikationsresultate auf den Datensätzen MNIST, SVHN und NORB erzielt.