HyperAIHyperAI

Command Palette

Search for a command to run...

Augmentation de la taille des GAN pour la synthèse d’images à partir de texte

Minguk Kang Jun-Yan Zhu Richard Zhang Jaesik Park Eli Shechtman Sylvain Paris Taesung Park

Résumé

La récente réussite de la synthèse d’images à partir de texte a bouleversé le monde et captivé l’imagination du grand public. Du point de vue technique, elle a également marqué un changement radical dans l’architecture privilégiée pour concevoir des modèles génératifs d’images. Les réseaux antagonistes génératifs (GAN) étaient autrefois le choix de référence, illustrés par des techniques telles que StyleGAN. Avec DALL-E 2, les modèles auto-régressifs et les modèles de diffusion sont devenus, du jour au lendemain, la nouvelle norme pour les modèles génératifs à grande échelle. Ce changement rapide soulève une question fondamentale : pouvons-nous étendre les GAN à une échelle suffisante pour tirer parti de grands jeux de données comme LAION ? Nous constatons qu’augmenter naïvement la capacité de l’architecture StyleGAN conduit rapidement à une instabilité. Nous introduisons GigaGAN, une nouvelle architecture GAN qui dépasse largement cette limite, démontrant ainsi que les GAN restent une option viable pour la synthèse d’images à partir de texte. GigaGAN présente trois avantages majeurs. Premièrement, il est d’un ordre de grandeur plus rapide en phase d’inférence, ne nécessitant que 0,13 seconde pour générer une image de 512 pixels. Deuxièmement, il permet la génération d’images à haute résolution, par exemple une image de 16 mégapixels en seulement 3,66 secondes. Enfin, GigaGAN prend en charge diverses applications d’édition dans l’espace latent, telles que l’interpolation latente, le mélange de styles et les opérations arithmétiques vectorielles.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp