HyperAIHyperAI

Command Palette

Search for a command to run...

StarGAN v2: Vielfältige Bildsynthese für mehrere Domänen

Yunjey Choi Youngjung Uh Jaejun Yoo Jung-Woo Ha

Zusammenfassung

Ein gutes Bild-zu-Bild-Übersetzungsmodell sollte eine Abbildung zwischen verschiedenen visuellen Domänen erlernen, während es die folgenden Eigenschaften erfüllt: 1) Vielfalt der generierten Bilder und 2) Skalierbarkeit über mehrere Domänen. Bestehende Methoden behandeln entweder eines der beiden Probleme, wobei sie eine begrenzte Vielfalt aufweisen oder für alle Domänen mehrere Modelle benötigen. Wir schlagen StarGAN v2 vor, einen einheitlichen Ansatz, der beide Probleme angeht und signifikant verbesserte Ergebnisse im Vergleich zu den Baselines zeigt. Experimente mit CelebA-HQ und einem neuen Datensatz von Tiergesichtern (AFHQ) bestätigen unsere Überlegenheit hinsichtlich visueller Qualität, Vielfalt und Skalierbarkeit. Um die Bewertung von Bild-zu-Bild-Übersetzungsmodellen zu verbessern, veröffentlichen wir AFHQ, hochwertige Tiergesichter mit großen Unterschieden sowohl innerhalb als auch zwischen den Domänen. Der Code, die vorab trainierten Modelle und der Datensatz sind unter https://github.com/clovaai/stargan-v2 verfügbar.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
StarGAN v2: Vielfältige Bildsynthese für mehrere Domänen | Paper | HyperAI