GENIE: Höherordnende Rauschbeseitigungs-Diffusionslöser

Denoising-Diffusions-Modelle (DDMs) sind zu einer leistungsfähigen Klasse generativer Modelle hervorgegangen. Ein Vorwärts-Diffusionsprozess stört die Daten langsam auf, während ein tiefes Modell lernt, diese schrittweise zu de-noisieren. Die Synthese entspricht der Lösung einer Differentialgleichung (DE), die durch das gelernte Modell definiert ist. Die Lösung der DE erfordert für die Erzeugung hochwertiger Daten langsame iterative Löser. In dieser Arbeit präsentieren wir Higher-Order Denoising Diffusion Solvers (GENIE): Basierend auf truncierten Taylor-Methoden leiten wir einen neuartigen, höheren Ordnung lösenden Ansatz ab, der die Synthese erheblich beschleunigt. Unser Löser beruht auf höheren Ableitungen der gestörten Datenausbreitung, also auf höheren Ordnung Score-Funktionen. In der Praxis sind lediglich Jacobian-Vektor-Produkte (JVPs) erforderlich, die wir aus dem ersten Ordnung Score-Netzwerk mittels automatischer Differentiation extrahieren. Diese JVPs werden anschließend in ein separates neuronales Netzwerk komprimiert, das es uns ermöglicht, während der Synthese effizient die notwendigen höheren Ordnungsterme für unseren neuen Sampler zu berechnen. Wir müssen lediglich einen kleinen zusätzlichen Kopf oberhalb des ersten Ordnung Score-Netzwerks trainieren. Wir validieren GENIE an mehreren Benchmarks für Bildgenerierung und zeigen, dass GENIE alle bisherigen Löser übertrifft. Im Gegensatz zu jüngeren Methoden, die den Generierungsprozess in DDMs grundlegend verändern, löst unser GENIE die echte generative Differentialgleichung und ermöglicht weiterhin Anwendungen wie Encoding und geführte Sampling. Projektseite und Code: https://nv-tlabs.github.io/GENIE.