HyperAIHyperAI
il y a 2 mois

StarGAN v2 : Synthèse d'images diversifiées pour plusieurs domaines

Choi, Yunjey ; Uh, Youngjung ; Yoo, Jaejun ; Ha, Jung-Woo
StarGAN v2 : Synthèse d'images diversifiées pour plusieurs domaines
Résumé

Un bon modèle de traduction d'image à image devrait apprendre une correspondance entre différents domaines visuels tout en satisfaisant aux propriétés suivantes : 1) diversité des images générées et 2) scalabilité sur plusieurs domaines. Les méthodes existantes abordent généralement l'une ou l'autre de ces problématiques, soit avec une diversité limitée, soit en utilisant plusieurs modèles pour tous les domaines. Nous proposons StarGAN v2, un cadre unique qui résout ces deux problèmes et montre des résultats significativement améliorés par rapport aux modèles de base. Des expériences menées sur CelebA-HQ et un nouveau jeu de données de visages d'animaux (AFHQ) ont validé notre supériorité en termes de qualité visuelle, de diversité et de scalabilité. Pour évaluer plus efficacement les modèles de traduction d'image à image, nous mettons à disposition AFHQ, un ensemble d'images de haute qualité de visages d'animaux présentant de grandes différences inter- et intra-domaines. Le code source, les modèles pré-entraînés et le jeu de données sont disponibles à l'adresse suivante : https://github.com/clovaai/stargan-v2.

StarGAN v2 : Synthèse d'images diversifiées pour plusieurs domaines | Articles de recherche récents | HyperAI