HyperAIHyperAI
vor 2 Monaten

Kompensatorische Stichprobenziehung für verbesserte Konvergenz in Diffusionsmodellen

Lu, Hui ; Salah, Albert ali ; Poppe, Ronald
Kompensatorische Stichprobenziehung für verbesserte Konvergenz in Diffusionsmodellen
Abstract

Diffusionsmodelle erreichen bemerkenswerte Qualität bei der Bildgenerierung, aber zu einem Preis. Die iterative Entrauschung erfordert viele Zeitschritte, um hochwertige Bilder zu produzieren. Wir argumentieren, dass der Entrauschungsprozess durch eine Akkumulation des Rekonstruktionsfehlers, bedingt durch eine anfänglich ungenaue Rekonstruktion der Ziel Daten, entscheidend eingeschränkt wird. Dies führt zu Ergebnissen von geringerer Qualität und langsamerer Konvergenz. Um dieses Problem anzugehen, schlagen wir die Kompensationssampling-Methode vor, um die Generierung in Richtung des Zielfeldes zu lenken. Wir führen einen Kompensationsausdruck ein, der als U-Net implementiert ist und während des Trainings sowie optional auch während der Inferenz einen vernachlässigbaren Rechenaufwand verursacht. Unser Ansatz ist flexibel und wir demonstrieren seine Anwendung bei bedingungsloser Generierung, Gesichtsinpainting und Gesichtsde-Occlusion unter Verwendung der Benchmark-Datensätze CIFAR-10, CelebA, CelebA-HQ, FFHQ-256 und FSG. Unser Ansatz liefert konsistent Stand-of-the-Art-Ergebnisse hinsichtlich der Bildqualität und beschleunigt den Entrauschungsprozess während des Trainings bis zu einer Größenordnung.请注意,"FSG" 作为一个数据集名称,通常会保留其原始形式,因此在德语中也直接使用 "FSG"。同样,"U-Net" 也是常用的术语,在德语中通常也会直接使用。

Kompensatorische Stichprobenziehung für verbesserte Konvergenz in Diffusionsmodellen | Neueste Forschungsarbeiten | HyperAI