HyperAIHyperAI
vor 2 Monaten

StarGAN v2: Vielfältige Bildsynthese für mehrere Domänen

Choi, Yunjey ; Uh, Youngjung ; Yoo, Jaejun ; Ha, Jung-Woo
StarGAN v2: Vielfältige Bildsynthese für mehrere Domänen
Abstract

Ein gutes Bild-zu-Bild-Übersetzungsmodell sollte eine Abbildung zwischen verschiedenen visuellen Domänen erlernen, während es die folgenden Eigenschaften erfüllt: 1) Vielfalt der generierten Bilder und 2) Skalierbarkeit über mehrere Domänen. Bestehende Methoden behandeln entweder eines der beiden Probleme, wobei sie eine begrenzte Vielfalt aufweisen oder für alle Domänen mehrere Modelle benötigen. Wir schlagen StarGAN v2 vor, einen einheitlichen Ansatz, der beide Probleme angeht und signifikant verbesserte Ergebnisse im Vergleich zu den Baselines zeigt. Experimente mit CelebA-HQ und einem neuen Datensatz von Tiergesichtern (AFHQ) bestätigen unsere Überlegenheit hinsichtlich visueller Qualität, Vielfalt und Skalierbarkeit. Um die Bewertung von Bild-zu-Bild-Übersetzungsmodellen zu verbessern, veröffentlichen wir AFHQ, hochwertige Tiergesichter mit großen Unterschieden sowohl innerhalb als auch zwischen den Domänen. Der Code, die vorab trainierten Modelle und der Datensatz sind unter https://github.com/clovaai/stargan-v2 verfügbar.

StarGAN v2: Vielfältige Bildsynthese für mehrere Domänen | Neueste Forschungsarbeiten | HyperAI