HyperAIHyperAI
il y a 3 mois

Apprentissage des modèles fondés sur l'énergie par vraisemblance de récupération par diffusion

Ruiqi Gao, Yang Song, Ben Poole, Ying Nian Wu, Diederik P. Kingma
Apprentissage des modèles fondés sur l'énergie par vraisemblance de récupération par diffusion
Résumé

Bien que les modèles basés sur l’énergie (EBM) présentent plusieurs propriétés souhaitables, leur entraînement et leur échantillonnage sur des jeux de données à haute dimension restent des défis. Inspirés par les progrès récents réalisés sur les modèles probabilistes de diffusion, nous proposons une méthode de vraisemblance de récupération par diffusion, permettant d’apprendre de manière efficace et d’échantillonner à partir d’une séquence d’EBM entraînés sur des versions de plus en plus bruitées d’un jeu de données. Chaque EBM est entraîné via la vraisemblance de récupération, qui consiste à maximiser la probabilité conditionnelle des données à un niveau de bruit donné, étant donné leurs versions bruitées à un niveau de bruit plus élevé. L’optimisation de la vraisemblance de récupération est plus aisée que celle de la vraisemblance marginale, car l’échantillonnage à partir des distributions conditionnelles est nettement plus simple que celui à partir des distributions marginales. Une fois entraîné, l’échantillonnage permet de générer des images synthétiques en partant d’une distribution de bruit blanc gaussien et en échantillonnant progressivement les distributions conditionnelles à des niveaux de bruit décroissants. Notre méthode produit des échantillons de haute fidélité sur divers jeux de données d’images. Sur CIFAR-10 sans condition, elle atteint un FID de 9,58 et un score d’inception de 8,30, surpassant la majorité des GANs. En outre, nous démontrons qu’à la différence des travaux antérieurs sur les EBM, les échantillons MCMC à long terme issus des distributions conditionnelles ne divergent pas et restent représentatifs d’images réalistes, permettant ainsi une estimation précise de la densité normalisée des données, même pour des jeux de données à haute dimension. Notre implémentation est disponible à l’adresse suivante : https://github.com/ruiqigao/recovery_likelihood.