HyperAIHyperAI
vor 2 Monaten

StarGAN: Einheitliche Generative Adversarial Networks für die Mehrdomänen-Bildübersetzung

Yunjey Choi; Minje Choi; Munyoung Kim; Jung-Woo Ha; Sunghun Kim; Jaegul Choo
StarGAN: Einheitliche Generative Adversarial Networks für die Mehrdomänen-Bildübersetzung
Abstract

Neueste Studien haben erheblichen Erfolg bei der Bild-zu-Bild-Übersetzung für zwei Domains gezeigt. Bestehende Ansätze haben jedoch begrenzte Skalierbarkeit und Robustheit bei der Verarbeitung mehrerer Domains, da für jedes Paar von Bild-Domains jeweils separate Modelle erstellt werden müssen. Um diese Einschränkung zu überwinden, schlagen wir StarGAN vor, einen neuartigen und skalierbaren Ansatz, der Bild-zu-Bild-Übersetzungen für mehrere Domains mit nur einem Modell durchführen kann. Die einheitliche Modellarchitektur von StarGAN ermöglicht die gleichzeitige Training von mehreren Datensätzen mit verschiedenen Domains innerhalb eines einzigen Netzwerks. Dies führt dazu, dass StarGAN sowohl eine überlegene Qualität der übersetzten Bilder im Vergleich zu bestehenden Modellen aufweist als auch die neuartige Fähigkeit, ein Eingangsbild flexibel in jedes gewünschte Ziel-Domain zu übersetzen. Wir demonstrieren die Effektivität unseres Ansatzes empirisch anhand von Aufgaben zur Gesichtsattributübertragung und zur Synthese von Gesichtsausdrücken.