Eine stilsbasierte Generatorenarchitektur für Generative Adversarial Networks

Wir schlagen eine alternative Generator-Architektur für Generative Adversarial Networks (GANs) vor, die sich aus der Literatur zum Stiltransfer inspirieren lässt. Die neue Architektur führt zu einer automatisch gelernten, unüberwachten Trennung hochstufiger Attribute (z.B. Pose und Identität bei der Ausbildung auf menschlichen Gesichtern) und stochastischer Variationen in den generierten Bildern (z.B. Sommersprossen, Haare) und ermöglicht eine intuitive, skalenbezogene Steuerung der Synthese. Der neue Generator verbessert den Stand der Technik hinsichtlich traditioneller Metriken zur Verteilungsqualität, zeigt nachweisbar bessere Interpolations-Eigenschaften und trennt auch die latenten Variationselemente besser voneinander. Um die Interpolationsqualität und die Entflechtung zu quantifizieren, schlagen wir zwei neue, automatisierte Methoden vor, die auf jede Generator-Architektur anwendbar sind. Schließlich stellen wir einen neuen Datensatz von menschlichen Gesichtern vor, der sowohl hochvariiert als auch hoher Qualität ist.