HyperAIHyperAI

Command Palette

Search for a command to run...

StarGAN v2 : Synthèse d'images diversifiées pour plusieurs domaines

Yunjey Choi Youngjung Uh Jaejun Yoo Jung-Woo Ha

Résumé

Un bon modèle de traduction d'image à image devrait apprendre une correspondance entre différents domaines visuels tout en satisfaisant aux propriétés suivantes : 1) diversité des images générées et 2) scalabilité sur plusieurs domaines. Les méthodes existantes abordent généralement l'une ou l'autre de ces problématiques, soit avec une diversité limitée, soit en utilisant plusieurs modèles pour tous les domaines. Nous proposons StarGAN v2, un cadre unique qui résout ces deux problèmes et montre des résultats significativement améliorés par rapport aux modèles de base. Des expériences menées sur CelebA-HQ et un nouveau jeu de données de visages d'animaux (AFHQ) ont validé notre supériorité en termes de qualité visuelle, de diversité et de scalabilité. Pour évaluer plus efficacement les modèles de traduction d'image à image, nous mettons à disposition AFHQ, un ensemble d'images de haute qualité de visages d'animaux présentant de grandes différences inter- et intra-domaines. Le code source, les modèles pré-entraînés et le jeu de données sont disponibles à l'adresse suivante : https://github.com/clovaai/stargan-v2.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
StarGAN v2 : Synthèse d'images diversifiées pour plusieurs domaines | Articles | HyperAI