HyperAIHyperAI

Command Palette

Search for a command to run...

vor 2 Monaten

InfGen: Ein auflösungsunabhängiger Ansatz für skalierbare Bildsynthese

Tao Han Wanghan Xu Junchao Gong Xiaoyu Yue Song Guo Luping Zhou Lei Bai

InfGen: Ein auflösungsunabhängiger Ansatz für skalierbare Bildsynthese

Abstract

Die generische Auflösungsbildgenerierung bietet eine konsistente visuelle Erfahrung über verschiedene Geräte hinweg und weist umfangreiche Anwendungsmöglichkeiten sowohl für Produzenten als auch für Verbraucher auf. Aktuelle Diffusionsmodelle erhöhen die Rechenanforderungen quadratisch mit der Auflösung, was zu Verzögerungen bei der Generierung von 4K-Bildern von über 100 Sekunden führt. Um dieses Problem zu lösen, erforschen wir die zweite Generation der latenzbasierten Diffusionsmodelle, bei denen die durch das Diffusionsmodell generierte feste Latenz als Inhaltssrepräsentation betrachtet wird. Wir schlagen vor, Bilder mit beliebiger Auflösung mit einer kompakten, vorgegebenen Latenz mittels eines einstufigen Generators zu dekodieren. Hierdurch präsentieren wir InfGen, das den VAE-Decoder durch einen neuen Generator ersetzt und die Erzeugung von Bildern beliebiger Auflösung aus einer festen Latenzgröße ermöglicht, ohne die Diffusionsmodelle neu zu trainieren. Dies vereinfacht den Prozess, reduziert die Rechenkomplexität und ist auf beliebige Modelle anwendbar, die denselben Latenzraum nutzen. Experimente zeigen, dass InfGen in der Lage ist, zahlreiche bestehende Modelle in das Zeitalter beliebiger hochauflösender Bilder zu führen, während gleichzeitig die Generierungszeit für 4K-Bilder auf unter 10 Sekunden sinkt.

KI mit KI entwickeln

Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.

KI-Co-Coding
Sofort einsatzbereit GPUs
Beste Preise
Jetzt starten

Hyper Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
InfGen: Ein auflösungsunabhängiger Ansatz für skalierbare Bildsynthese | Forschungsarbeiten | HyperAI