HyperAIHyperAI

Command Palette

Search for a command to run...

il y a 2 mois

InfGen : un paradigme indépendant de la résolution pour la synthèse d’images évolutif

Tao Han Wanghan Xu Junchao Gong Xiaoyu Yue Song Guo Luping Zhou Lei Bai

InfGen : un paradigme indépendant de la résolution pour la synthèse d’images évolutif

Résumé

La génération d’images à résolution arbitraire offre une expérience visuelle cohérente à travers les appareils, avec des applications étendues tant pour les producteurs que pour les consommateurs. Les modèles de diffusion actuels entraînent une augmentation quadratique de la charge de calcul avec la résolution, ce qui provoque des délais de génération d’images 4K dépassant 100 secondes. Pour résoudre ce problème, nous explorons une deuxième génération de modèles de diffusion latente, dans laquelle le latent fixe généré par les modèles de diffusion est considéré comme une représentation du contenu, et nous proposons de décoder des images à résolution arbitraire à partir d’un latent généré compact, en utilisant un générateur à une seule étape. Ainsi, nous introduisons InfGen, qui remplace le décodeur VAE par un nouveau générateur, permettant de produire des images à toute résolution à partir d’un latent de taille fixe, sans réentraînement des modèles de diffusion. Cette approche simplifie le processus, réduit la complexité computationnelle et peut être appliquée à tout modèle utilisant le même espace latent. Les expériences montrent qu’InfGen permet de faire passer de nombreux modèles dans l’ère de la haute résolution arbitraire, tout en réduisant le temps de génération d’une image 4K à moins de 10 secondes.

Construire l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.

Co-codage IA
GPU prêts à utiliser
Meilleurs prix
Commencer

Hyper Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
InfGen : un paradigme indépendant de la résolution pour la synthèse d’images évolutif | Articles de recherche | HyperAI