Command Palette
Search for a command to run...
UltraHR-100K : Amélioration de la synthèse d’images ultra-haute résolution grâce à un jeu de données à grande échelle et de haute qualité
Chen Zhao En Ci Yunzhe Xu Tiehan Fan Shanyan Guan Yanhao Ge Jian Yang Ying Tai

Résumé
La génération d’images à partir de texte (T2I) à ultra-haute résolution (UHR) a connu des progrès notables. Toutefois, deux défis majeurs persistent : (1) l’absence d’un jeu de données UHR de grande ampleur et de haute qualité, et (2) le manque de stratégies d’entraînement adaptées à la synthèse de détails fins dans les scénarios UHR. Pour relever le premier défi, nous introduisons \textbf{UltraHR-100K}, un jeu de données de haute qualité comprenant 100 000 images UHR accompagnées de descriptions riches, offrant une diversité de contenus et une fidélité visuelle élevée. Chaque image dépasse une résolution de 3K et a été soigneusement sélectionnée selon des critères de richesse détaillée, de complexité du contenu et de qualité esthétique. Pour surmonter le second défi, nous proposons une méthode d’entraînement postérieur sensible aux fréquences, visant à améliorer la génération de détails fins dans les modèles de diffusion T2I. Plus précisément, nous concevons (i) un échantillonnage temporel orienté vers les détails (DOTS), qui concentre l’apprentissage sur les étapes critiques de débruitage liées aux détails, et (ii) une régularisation par pondération douce des fréquences (SWFR), qui exploite la transformation de Fourier discrète (DFT) pour contraindre doucement les composantes fréquentielles, favorisant ainsi la préservation des détails de haute fréquence. Des expérimentations étendues sur les benchmarks UltraHR-eval4K que nous proposons démontrent que notre approche améliore de manière significative la qualité des détails fins et la fidélité globale de la génération d’images UHR. Le code est disponible à l’adresse \href{this https URL}{ici}.
Construire l'IA avec l'IA
De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.