HyperAIHyperAI
il y a 17 jours

Affinement du processus génératif par une guidance du discriminateur dans les modèles de diffusion basés sur les scores

Dongjun Kim, Yeongmin Kim, Se Jung Kwon, Wanmo Kang, Il-Chul Moon
Affinement du processus génératif par une guidance du discriminateur dans les modèles de diffusion basés sur les scores
Résumé

La méthode proposée, appelée Discriminator Guidance, vise à améliorer la génération d’échantillons des modèles de diffusion pré-entraînés. L’approche introduit un discriminateur qui fournit une supervision explicite au chemin de débruitage des échantillons, afin de déterminer s’ils sont réalistes ou non. Contrairement aux GANs, notre méthode ne nécessite pas d’entraînement conjoint des réseaux de score et de discriminateur. À la place, nous entraînons le discriminateur après l’entraînement du réseau de score, ce qui rend l’entraînement du discriminateur stable et rapide à converger. Lors de la génération d’échantillons, nous ajoutons un terme auxiliaire au score pré-entraîné afin de tromper le discriminateur. Ce terme ajuste le score du modèle vers le score des données optimal au niveau du discriminateur, ce qui implique que le discriminateur contribue de manière complémentaire à une estimation plus précise du score. Grâce à notre algorithme, nous obtenons des résultats de pointe sur ImageNet 256x256, avec un FID de 1,83 et un rappel de 0,64, comparables aux valeurs de validation (FID : 1,68, rappel : 0,66). Le code source est disponible à l’adresse suivante : https://github.com/alsdudrla10/DG.

Affinement du processus génératif par une guidance du discriminateur dans les modèles de diffusion basés sur les scores | Articles de recherche récents | HyperAI