Command Palette
Search for a command to run...
Affinement du processus génératif par une guidance du discriminateur dans les modèles de diffusion basés sur les scores
Affinement du processus génératif par une guidance du discriminateur dans les modèles de diffusion basés sur les scores
Dongjun Kim Yeongmin Kim Se Jung Kwon Wanmo Kang Il-Chul Moon
Résumé
La méthode proposée, appelée Discriminator Guidance, vise à améliorer la génération d’échantillons des modèles de diffusion pré-entraînés. L’approche introduit un discriminateur qui fournit une supervision explicite au chemin de débruitage des échantillons, afin de déterminer s’ils sont réalistes ou non. Contrairement aux GANs, notre méthode ne nécessite pas d’entraînement conjoint des réseaux de score et de discriminateur. À la place, nous entraînons le discriminateur après l’entraînement du réseau de score, ce qui rend l’entraînement du discriminateur stable et rapide à converger. Lors de la génération d’échantillons, nous ajoutons un terme auxiliaire au score pré-entraîné afin de tromper le discriminateur. Ce terme ajuste le score du modèle vers le score des données optimal au niveau du discriminateur, ce qui implique que le discriminateur contribue de manière complémentaire à une estimation plus précise du score. Grâce à notre algorithme, nous obtenons des résultats de pointe sur ImageNet 256x256, avec un FID de 1,83 et un rappel de 0,64, comparables aux valeurs de validation (FID : 1,68, rappel : 0,66). Le code source est disponible à l’adresse suivante : https://github.com/alsdudrla10/DG.