HyperAIHyperAI
vor 13 Tagen

Analyse und Verbesserung der Bildqualität von StyleGAN

Tero Karras, Samuli Laine, Miika Aittala, Janne Hellsten, Jaakko Lehtinen, Timo Aila
Analyse und Verbesserung der Bildqualität von StyleGAN
Abstract

Die stylbasierte GAN-Architektur (StyleGAN) erzielt derzeit die besten Ergebnisse im Bereich der datengetriebenen, bedingungslosen generativen Bildmodellierung. Wir identifizieren und analysieren mehrere charakteristische Artefakte dieser Architektur und schlagen Änderungen sowohl in der Modellarchitektur als auch in den Trainingsmethoden vor, um diese zu beheben. Insbesondere überarbeiten wir die Normalisierung im Generator, überprüfen erneut das Verfahren des progressiven Wachstums und regularisieren den Generator, um eine gute Bedingung des Abbildungsverhaltens von Latentcodes auf Bilder zu fördern. Neben der Verbesserung der Bildqualität bringt dieser Pfadlängen-Regulärer den zusätzlichen Vorteil, dass der Generator deutlich einfacher invertierbar wird. Dadurch ist es möglich, ein generiertes Bild zuverlässig einem bestimmten Netzwerk zuzuordnen. Zudem visualisieren wir, wie effektiv der Generator seine Ausgabauflösung nutzt, und identifizieren ein Kapazitätsproblem, das uns veranlasst, größere Modelle zu trainieren, um zusätzliche Qualitätsverbesserungen zu erzielen. Insgesamt definiert unser verbessertes Modell die neue State-of-the-Art in der bedingungslosen Bildmodellierung, sowohl hinsichtlich etablierter Verteilungsqualitätsmetriken als auch hinsichtlich der wahrgenommenen Bildqualität.

Analyse und Verbesserung der Bildqualität von StyleGAN | Neueste Forschungsarbeiten | HyperAI