HyperAIHyperAI

Command Palette

Search for a command to run...

Mise en cache évolutionnelle pour accélérer votre modèle de diffusion prêt à l'emploi

Aggarwal Anirud Shrivastava Abhinav Gwilliam Matthew

Résumé

Les modèles de génération d'images basés sur la diffusion excellent dans la production de contenu synthétique de haute qualité, mais souffrent d'une inférence lente et coûteuse en termes de calcul. Les travaux antérieurs ont tenté d'atténuer ce problème en mettant en cache et réutilisant des caractéristiques au sein des transformateurs de diffusion à travers les étapes d'inférence. Ces méthodes s'appuient cependant souvent sur des heuristiques rigides qui entraînent une accélération limitée ou une mauvaise généralisation entre les architectures. Nous proposons l'Evolutionary Caching to Accelerate Diffusion models (ECAD), un algorithme génétique qui apprend des horaires de mise en cache efficaces, spécifiques à chaque modèle, formant une frontière de Pareto, en utilisant uniquement un petit ensemble de prompts de calibration. ECAD ne nécessite aucune modification des paramètres du réseau ni des images de référence. Il offre des accélérations significatives de l'inférence, permet un contrôle fin du compromis qualité-latence et s'adapte sans effort à différents modèles de diffusion. Notamment, les horaires appris par ECAD peuvent se généraliser efficacement à des résolutions et des variantes de modèles non vus lors de la calibration. Nous évaluons ECAD sur PixArt-alpha, PixArt-Sigma et FLUX-1.dev en utilisant plusieurs métriques (FID, CLIP, Image Reward) sur diverses benchmarks (COCO, MJHQ-30k, PartiPrompts), démontrant des améliorations constantes par rapport aux approches précédentes. Sur PixArt-alpha, ECAD identifie un horaire qui surpasse la méthode précédente state-of-the-art avec une amélioration de 4,47 points COCO FID tout en augmentant le gain de vitesse d'inférence de 2,35x à 2,58x. Nos résultats établissent ECAD comme une approche évolutrice et généralisable pour accélérer l'inférence par diffusion. Notre site web du projet est disponible à l'adresse https://aniaggarwal.github.io/ecad et notre code source est disponible à l'adresse https://github.com/aniaggarwal/ecad.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp