HyperAIHyperAI

Command Palette

Search for a command to run...

Domestiquer les Transformers pour la synthèse d'images à haute résolution

Esser Patrick ; Rombach Robin ; Ommer Björn

Résumé

Conçus pour apprendre les interactions à longue portée sur des données séquentielles, les transformateurs continuent d'obtenir des résultats de pointe sur une grande variété de tâches. Contrairement aux CNNs (Convolutional Neural Networks), ils ne contiennent aucun biais inductif qui privilégie les interactions locales. Cela les rend expressifs, mais également computationnellement irréalistes pour des séquences longues, telles que des images à haute résolution. Nous démontrons comment la combinaison de l'efficacité du biais inductif des CNNs avec l'expressivité des transformateurs permet de modéliser et, par conséquent, de synthétiser des images à haute résolution. Nous montrons comment (i) utiliser les CNNs pour apprendre un vocabulaire riche en contexte d'éléments constitutifs d'images, et ensuite (ii) exploiter les transformateurs pour modéliser efficacement leur composition au sein d'images à haute résolution. Notre approche s'applique facilement aux tâches de synthèse conditionnelle, où tant les informations non spatiales, comme les classes d'objets, que les informations spatiales, comme les segmentations, peuvent contrôler l'image générée. En particulier, nous présentons les premiers résultats sur la synthèse guidée sémantiquement d'images mégapixels avec des transformateurs et obtenons l'état de l'art parmi les modèles auto-régressifs sur ImageNet conditionné aux classes. Le code source et les modèles pré-entraînés sont disponibles à l'adresse suivante : https://github.com/CompVis/taming-transformers .


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp