Schnell sein, wenn Daten mit scorebasierten Modellen generiert werden

Score-basierte (denoisende Diffusions-) Generativmodelle haben in letzter Zeit erheblichen Erfolg bei der Erzeugung realistischer und vielfältiger Daten erzielt. Diese Ansätze definieren einen vorwärtsgerichteten Diffusionsprozess, der Daten in Rauschen transformiert, und erzeugen Daten, indem sie diesen Prozess rückwärts durchlaufen (d.h. vom Rauschen zu den Daten). Leider erzeugen derzeitige score-basierte Modelle Daten äußerst langsam, da numerische SDE-Löser eine enorme Anzahl von Auswertungen des Score-Netzwerks erfordern.In dieser Arbeit zielen wir darauf ab, diesen Prozess zu beschleunigen, indem wir einen effizienteren SDE-Löser entwerfen. Bisherige Ansätze beruhen auf dem Euler-Maruyama (EM)-Löser, der eine feste Schrittweite verwendet. Wir stellten fest, dass eine naive Ersetzung durch andere SDE-Löser schlechte Ergebnisse liefert – entweder erzeugen sie geringe Qualität der Proben oder sind sogar langsamer als EM. Um dieses Problem zu umgehen, entwickeln wir schrittweise einen SDE-Löser mit adaptiver Schrittweite, der speziell auf score-basierte Generativmodelle abgestimmt ist. Unser Löser erfordert lediglich zwei Auswertungen der Score-Funktion, lehnt Proben selten ab und führt zu hochwertigen Ergebnissen. Unser Ansatz erzeugt Daten zwei bis zehn Mal schneller als EM, während gleichzeitig eine bessere oder mindestens gleichwertige Probenqualität erreicht wird. Für hochauflösende Bilder erzielt unsere Methode signifikant höhere Qualität als alle anderen getesteten Methoden. Der Vorteil unseres SDE-Lösers liegt darin, dass keine feinabgestimmte Schrittweiten-Einstellung erforderlich ist.