HyperAIHyperAI
vor 17 Tagen

Verfeinerung des generativen Prozesses mit Diskriminatoren-Leitlinien in scorebasierten Diffusionsmodellen

Dongjun Kim, Yeongmin Kim, Se Jung Kwon, Wanmo Kang, Il-Chul Moon
Verfeinerung des generativen Prozesses mit Diskriminatoren-Leitlinien in scorebasierten Diffusionsmodellen
Abstract

Die vorgeschlagene Methode, Discriminator Guidance, zielt darauf ab, die Generierung von Proben durch vortrainierte Diffusionsmodelle zu verbessern. Der Ansatz führt einen Diskriminators ein, der eine explizite Überwachung entlang des Entrauschungspfades einer Probe ermöglicht, um zu bestimmen, ob diese realistisch ist oder nicht. Im Gegensatz zu GANs erfordert unser Ansatz keine gemeinsame Trainingsschicht für Score- und Diskriminatoren-Netzwerke. Stattdessen trainieren wir den Diskriminators nach dem Abschluss des Score-Trainings, was ein stabiles und schnell konvergierendes Training des Diskriminators ermöglicht. Bei der Proben-Generierung fügen wir eine Hilfskomponente zum vortrainierten Score hinzu, um den Diskriminators zu täuschen. Dieser Term korrigiert den Modell-Score am optimalen Diskriminators auf den Daten-Score, was impliziert, dass der Diskriminators die Score-Schätzung komplementär verbessert. Mit unserem Algorithmus erreichen wir state-of-the-art-Ergebnisse auf ImageNet in Auflösung 256x256 mit einem FID von 1,83 und einem Recall von 0,64 – vergleichbar mit den Werten des Validierungsdatensatzes (FID 1,68 und Recall 0,66). Den Quellcode stellen wir unter https://github.com/alsdudrla10/DG zur Verfügung.

Verfeinerung des generativen Prozesses mit Diskriminatoren-Leitlinien in scorebasierten Diffusionsmodellen | Neueste Forschungsarbeiten | HyperAI