HyperAIHyperAI

Command Palette

Search for a command to run...

vor 4 Monaten

HiWave: Trainingsfreie Hochauflösende Bildgenerierung durch wellenbasiertes Diffusionsverfahren

Tobias Vontobel Seyedmorteza Sadat Farnood Salehi Romann M. Weber

HiWave: Trainingsfreie Hochauflösende Bildgenerierung durch wellenbasiertes Diffusionsverfahren

Abstract

Diffusionsmodelle sind als führende Methode für die Bildsynthese hervorgetreten und zeigen außergewöhnliche Fotorealismus und Vielfalt. Dennoch bleibt das Training von Diffusionsmodellen in hochauflösenden Bildern rechnerisch unerschwinglich, und existierende zero-shot-Generierungstechniken zur Synthese von Bildern über den Trainingsauflösungen hinaus erzeugen oft Artefakte, darunter Objektduplizierung und räumliche Inkohärenz. In dieser Arbeit stellen wir HiWave vor, einen trainingsfreien, zero-shot-Ansatz, der die visuelle Treue und strukturelle Kohärenz bei der Synthese von ultra-hochauflösenden Bildern unter Verwendung vortrainierter Diffusionsmodelle erheblich verbessert. Unsere Methode verwendet eine zweistufige Pipeline: Erstens wird ein Basisbild vom vortrainierten Modell generiert, gefolgt von einem patchweisen DDIM-Inversionschritt (DDIM) und einem neuartigen waveletbasierten Detailverstärkungsmodul. Insbesondere nutzen wir zuerst Inversionsmethoden, um anfängliche Rauschvektoren abzuleiten, die globale Kohärenz aus dem Basisbild bewahren. Anschließend behält unser waveletdomäner Detailverstärker während des Sammelns die Niederfrequenzkomponenten des Basisbildes, um strukturelle Konsistenz sicherzustellen, während er selektiv Hochfrequenzkomponenten leitet, um feine Details und Texturen zu bereichern. Ausführliche Bewertungen mit Stable Diffusion XL zeigen, dass HiWave häufige visuelle Artefakte früherer Methoden effektiv reduziert und eine überlegene perzeptive Qualität erreicht. Eine Nutzerstudie bestätigte HiWaves Leistungsfähigkeit; es wurde in mehr als 80 % der Vergleiche gegenüber dem aktuellen Stand der Technik bevorzugt, was seine Effektivität für hochwertige, ultra-hochauflösende Bildsynthese ohne erneutes Training oder architektonische Änderungen unterstreicht.

KI mit KI entwickeln

Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.

KI-Co-Coding
Sofort einsatzbereit GPUs
Beste Preise
Jetzt starten

Hyper Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
HiWave: Trainingsfreie Hochauflösende Bildgenerierung durch wellenbasiertes Diffusionsverfahren | Forschungsarbeiten | HyperAI