HyperAIHyperAI
il y a 17 jours

Méthodes numériques pseudo pour les modèles de diffusion sur les variétés

Luping Liu, Yi Ren, Zhijie Lin, Zhou Zhao
Méthodes numériques pseudo pour les modèles de diffusion sur les variétés
Résumé

Les Modèles Probabilistes de Diffusion Débruitants (DDPM) sont capables de générer des échantillons de haute qualité, tels que des images ou des extraits audio. Toutefois, les DDPM nécessitent des centaines voire des milliers d’itérations pour produire des échantillons finaux. Plusieurs travaux antérieurs ont réussi à accélérer les DDPM en ajustant le calendrier de variance (par exemple, les Improved Denoising Diffusion Probabilistic Models) ou l’équation de débruitage (par exemple, les Modèles de Diffusion Implicite Débruitants, DDIM). Toutefois, ces méthodes d’accélération peinent à préserver la qualité des échantillons et peuvent même introduire un bruit supplémentaire lors d’un taux d’accélération élevé, ce qui limite leur praticabilité. Afin d’accélérer le processus d’inférence tout en préservant la qualité des échantillons, nous proposons une nouvelle perspective selon laquelle les DDPM doivent être traités comme la résolution d’équations différentielles sur des variétés (manifolds). Dans ce cadre, nous introduisons des méthodes numériques pseudo-approchées pour les modèles de diffusion (PNDM). Plus précisément, nous déterminons comment résoudre des équations différentielles sur des variétés, et montrons que les DDIM constituent un cas particulier simple de méthodes numériques pseudo-approchées. Nous adaptons plusieurs méthodes numériques classiques en leurs variantes pseudo-approchées correspondantes, et constatons que la méthode pseudo-multistep linéaire se révèle optimale dans la plupart des situations. Selon nos expériences, en utilisant directement des modèles pré-entraînés sur CIFAR-10, CelebA et LSUN, les PNDM produisent des images synthétiques de qualité supérieure en seulement 50 étapes, contre 1000 étapes pour les DDIM (accélération de 20x), surpassant significativement les DDIM avec 250 étapes (amélioration d’environ 0,4 au score FID), tout en offrant une bonne généralisation sur divers calendriers de variance. Notre implémentation est disponible à l’adresse suivante : https://github.com/luping-liu/PNDM.

Méthodes numériques pseudo pour les modèles de diffusion sur les variétés | Articles de recherche récents | HyperAI