HyperAIHyperAI

Command Palette

Search for a command to run...

InfGen : un paradigme indépendant de la résolution pour la synthèse d’images évolutif

Tao Han Wanghan Xu Junchao Gong Xiaoyu Yue Song Guo Luping Zhou Lei Bai

Résumé

La génération d’images à résolution arbitraire offre une expérience visuelle cohérente à travers les appareils, avec des applications étendues tant pour les producteurs que pour les consommateurs. Les modèles de diffusion actuels entraînent une augmentation quadratique de la charge de calcul avec la résolution, ce qui provoque des délais de génération d’images 4K dépassant 100 secondes. Pour résoudre ce problème, nous explorons une deuxième génération de modèles de diffusion latente, dans laquelle le latent fixe généré par les modèles de diffusion est considéré comme une représentation du contenu, et nous proposons de décoder des images à résolution arbitraire à partir d’un latent généré compact, en utilisant un générateur à une seule étape. Ainsi, nous introduisons InfGen, qui remplace le décodeur VAE par un nouveau générateur, permettant de produire des images à toute résolution à partir d’un latent de taille fixe, sans réentraînement des modèles de diffusion. Cette approche simplifie le processus, réduit la complexité computationnelle et peut être appliquée à tout modèle utilisant le même espace latent. Les expériences montrent qu’InfGen permet de faire passer de nombreux modèles dans l’ère de la haute résolution arbitraire, tout en réduisant le temps de génération d’une image 4K à moins de 10 secondes.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
InfGen : un paradigme indépendant de la résolution pour la synthèse d’images évolutif | Articles | HyperAI