Diffusion-Modelle ohne klassifizierungsfreie Leitlinien

Diese Arbeit präsentiert Model-guidance (MG), ein neuartiges Ziel für das Training von Diffusionsmodellen, das das häufig verwendete Classifier-free Guidance (CFG) adressiert und eliminiert. Unser innovativer Ansatz geht über die herkömmliche Modellierung der reinen Datensverteilung hinaus, indem er die bedingte Posterior-Wahrscheinlichkeit explizit einbezieht. Die vorgeschlagene Technik basiert auf der Idee von CFG, ist dennoch einfach und äußerst wirksam, wodurch sie als plug-and-play-Modul für bestehende Modelle genutzt werden kann. Unser Verfahren beschleunigt signifikant den Trainingsprozess, verdoppelt die Inferenzgeschwindigkeit und erreicht eine herausragende Qualität, die sowohl konkurrierende Diffusionsmodelle mit CFG übertrifft als auch parallel dazu steht. Umfangreiche Experimente belegen die Wirksamkeit, Effizienz und Skalierbarkeit unserer Methode auf verschiedenen Modellen und Datensätzen. Schließlich erzielen wir einen state-of-the-art-Performance auf den ImageNet 256-Benchmarks mit einer FID von 1,34. Der Quellcode ist unter https://github.com/tzco/Diffusion-wo-CFG verfügbar.