HyperAIHyperAI

Command Palette

Search for a command to run...

vor 19 Tagen

UltraHR-100K: Verbesserung der UHR-Bildsynthese mit einem großflächigen, hochwertigen Datensatz

Chen Zhao En Ci Yunzhe Xu Tiehan Fan Shanyan Guan Yanhao Ge Jian Yang Ying Tai

UltraHR-100K: Verbesserung der UHR-Bildsynthese mit einem großflächigen, hochwertigen Datensatz

Abstract

Die Erzeugung von Text-zu-Bild (T2I)-Bildern mit ultra-hoher Auflösung (UHR) hat erhebliche Fortschritte gemacht. Zwei zentrale Herausforderungen bleiben jedoch bestehen: (1) das Fehlen einer großskaligen, hochwertigen UHR-T2I-Datensammlung und (2) die Vernachlässigung spezifischer Trainingsstrategien zur Synthese feinster Details in UHR-Szenarien. Um die erste Herausforderung anzugehen, führen wir \textbf{UltraHR-100K} ein – eine hochwertige Datensammlung mit 100.000 UHR-Bildern und detaillierten Beschreibungen, die eine vielfältige Inhaltsspanne und hohe visuelle Fidelität aufweisen. Jedes Bild weist eine Auflösung von über 3.000 Pixeln auf und wurde sorgfältig ausgewählt, basierend auf der Detaildichte, der inhaltlichen Komplexität und der ästhetischen Qualität. Um die zweite Herausforderung zu bewältigen, schlagen wir eine frequenzbewusste Nachtrainingsmethode vor, die die Generierung feinster Details in T2I-Diffusionsmodellen verbessert. Konkret entwickeln wir (i) \textit{Detail-Oriented Timestep Sampling (DOTS)}, um das Lernen auf die denoising-entscheidenden Schritte zu fokussieren, bei denen feine Details kritisch sind, sowie (ii) \textit{Soft-Weighting Frequency Regularization (SWFR)}, die die diskrete Fourier-Transformation (DFT) nutzt, um Frequenzkomponenten weich zu regularisieren und so die Erhaltung hochfrequenter Details zu fördern. Ausführliche Experimente an den von uns vorgeschlagenen UltraHR-eval4K-Benchmarks zeigen, dass unser Ansatz die Qualität feinster Details und die insgesamt hohe Fidelität der UHR-Bildgenerierung erheblich verbessert. Der Quellcode ist unter \href{this https URL}{hier} verfügbar.

KI mit KI entwickeln

Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.

KI-Co-Coding
Sofort einsatzbereit GPUs
Beste Preise
Jetzt starten

Hyper Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
UltraHR-100K: Verbesserung der UHR-Bildsynthese mit einem großflächigen, hochwertigen Datensatz | Forschungsarbeiten | HyperAI