HyperAIHyperAI

Command Palette

Search for a command to run...

Méthodes numériques pseudo pour les modèles de diffusion sur les variétés

Luping Liu Yi Ren Zhijie Lin Zhou Zhao

Résumé

Les Modèles Probabilistes de Diffusion Débruitants (DDPM) sont capables de générer des échantillons de haute qualité, tels que des images ou des extraits audio. Toutefois, les DDPM nécessitent des centaines voire des milliers d’itérations pour produire des échantillons finaux. Plusieurs travaux antérieurs ont réussi à accélérer les DDPM en ajustant le calendrier de variance (par exemple, les Improved Denoising Diffusion Probabilistic Models) ou l’équation de débruitage (par exemple, les Modèles de Diffusion Implicite Débruitants, DDIM). Toutefois, ces méthodes d’accélération peinent à préserver la qualité des échantillons et peuvent même introduire un bruit supplémentaire lors d’un taux d’accélération élevé, ce qui limite leur praticabilité. Afin d’accélérer le processus d’inférence tout en préservant la qualité des échantillons, nous proposons une nouvelle perspective selon laquelle les DDPM doivent être traités comme la résolution d’équations différentielles sur des variétés (manifolds). Dans ce cadre, nous introduisons des méthodes numériques pseudo-approchées pour les modèles de diffusion (PNDM). Plus précisément, nous déterminons comment résoudre des équations différentielles sur des variétés, et montrons que les DDIM constituent un cas particulier simple de méthodes numériques pseudo-approchées. Nous adaptons plusieurs méthodes numériques classiques en leurs variantes pseudo-approchées correspondantes, et constatons que la méthode pseudo-multistep linéaire se révèle optimale dans la plupart des situations. Selon nos expériences, en utilisant directement des modèles pré-entraînés sur CIFAR-10, CelebA et LSUN, les PNDM produisent des images synthétiques de qualité supérieure en seulement 50 étapes, contre 1000 étapes pour les DDIM (accélération de 20x), surpassant significativement les DDIM avec 250 étapes (amélioration d’environ 0,4 au score FID), tout en offrant une bonne généralisation sur divers calendriers de variance. Notre implémentation est disponible à l’adresse suivante : https://github.com/luping-liu/PNDM.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp