HyperAIHyperAI

Command Palette

Search for a command to run...

Verfeinerung des generativen Prozesses mit Diskriminatoren-Leitlinien in scorebasierten Diffusionsmodellen

Dongjun Kim Yeongmin Kim Se Jung Kwon Wanmo Kang Il-Chul Moon

Zusammenfassung

Die vorgeschlagene Methode, Discriminator Guidance, zielt darauf ab, die Generierung von Proben durch vortrainierte Diffusionsmodelle zu verbessern. Der Ansatz führt einen Diskriminators ein, der eine explizite Überwachung entlang des Entrauschungspfades einer Probe ermöglicht, um zu bestimmen, ob diese realistisch ist oder nicht. Im Gegensatz zu GANs erfordert unser Ansatz keine gemeinsame Trainingsschicht für Score- und Diskriminatoren-Netzwerke. Stattdessen trainieren wir den Diskriminators nach dem Abschluss des Score-Trainings, was ein stabiles und schnell konvergierendes Training des Diskriminators ermöglicht. Bei der Proben-Generierung fügen wir eine Hilfskomponente zum vortrainierten Score hinzu, um den Diskriminators zu täuschen. Dieser Term korrigiert den Modell-Score am optimalen Diskriminators auf den Daten-Score, was impliziert, dass der Diskriminators die Score-Schätzung komplementär verbessert. Mit unserem Algorithmus erreichen wir state-of-the-art-Ergebnisse auf ImageNet in Auflösung 256x256 mit einem FID von 1,83 und einem Recall von 0,64 – vergleichbar mit den Werten des Validierungsdatensatzes (FID 1,68 und Recall 0,66). Den Quellcode stellen wir unter https://github.com/alsdudrla10/DG zur Verfügung.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
Verfeinerung des generativen Prozesses mit Diskriminatoren-Leitlinien in scorebasierten Diffusionsmodellen | Paper | HyperAI