Adversarial Latent Autoencoders

Autoencoder-Netzwerke sind anspruchslose Ansätze, die darauf abzielen, generative und repräsentative Eigenschaften durch die gleichzeitige Lernung einer Encoder-Generator-Abbildung zu kombinieren. Obwohl sie umfassend untersucht wurden, sind Fragen hinsichtlich ihres generativen Potenzials im Vergleich zu GANs oder ihrer Fähigkeit, entkoppelte Darstellungen zu lernen, bisher nicht vollständig geklärt. Wir stellen einen Autoencoder vor, der diese Probleme gemeinsam angeht, den wir adversarial latent autoencoder (ALAE) nennen. Es handelt sich um eine allgemeine Architektur, die jüngste Fortschritte in der Trainingsprozedur von GANs nutzen kann. Wir haben zwei Autoencoder entworfen: einen basierend auf einem MLP-Encoder und einen anderen basierend auf einem StyleGAN-Generator, den wir StyleALAE nennen. Wir bestätigen die Entkoppelungseigenschaften beider Architekturen. Wir zeigen, dass StyleALAE nicht nur Gesichtsbilder der Auflösung 1024×1024 mit vergleichbarer Qualität wie StyleGAN erzeugen kann, sondern auch bei derselben Auflösung Rekonstruktionen und Manipulationen von echten Bildern ermöglicht. Damit stellt ALAE den ersten Autoencoder dar, der mit einer reiner Generator-Architektur konkurrieren und deren Fähigkeiten sogar übertreffen kann.