PFGM++: Das Potenzial physikinspirierter Generativer Modelle freisetzen

Wir stellen eine neue Familie von physikinspirierten generativen Modellen vor, die als PFGM++ bezeichnet werden und Diffusionsmodelle sowie Poisson-Flow-Generative Modelle (PFGM) vereinen. Diese Modelle realisieren generative Trajektorien für $N$-dimensionale Daten, indem sie Pfade im $N{+}D$-dimensionalen Raum einbetten, während sie den Fortschritt weiterhin durch eine einfache skalare Norm der $D$ zusätzlichen Variablen steuern. Die neuen Modelle reduzieren sich auf PFGM, wenn $D{=}1$, und auf Diffusionsmodelle, wenn $D{\to}\infty$. Die Flexibilität bei der Wahl von $D$ ermöglicht es uns, Robustheit gegen Steifigkeit abzuwägen, da eine Erhöhung von $D$ zu einer konzentrierteren Kopplung zwischen den Daten und den Normen der zusätzlichen Variablen führt. Wir verzichten auf die in PFGM verwendeten verfälschten großen Batch-Feldziele und bieten stattdessen ein unverfälschtes störungsbasierendes Zielobjekt an, das类似 den Diffusionsmodellen ist. Um verschiedene Werte von $D$ zu untersuchen, stellen wir eine direkte Ausrichtungsmethode zur Verfügung, mit der gut justierte Hyperparameter von Diffusionsmodellen ($D{\to} \infty$) auf beliebige endliche $D$-Werte übertragen werden können. Unsere Experimente zeigen, dass Modelle mit endlichem $D$ bessere Ergebnisse als bisherige state-of-the-art-Diffusionsmodelle auf CIFAR-10/FFHQ 64×64-Datensätzen erzielen können, wobei FID-Werte von 1.91/2.43 bei $D{=}2048/128$ erreicht werden. Im klassenbedingten Szenario ergibt sich bei $D{=}2048$ der aktuelle state-of-the-art-FID-Wert von 1.74 auf CIFAR-10. Zudem demonstrieren wir, dass Modelle mit kleinerem $D$ gegenüber Modellfehlern verbesserte Robustheit aufweisen. Der Quellcode ist unter https://github.com/Newbeeer/pfgmpp verfügbar.请注意,为了保持科技新闻或学术写作的正式性和准确性,我在翻译中尽量使用了专业术语,并在必要时保留了原文中的符号和公式。同时,我也对句子结构进行了适当调整,以确保译文符合德语的表达习惯。