HyperAIHyperAI
il y a 11 jours

Diffusion simple : diffusion bout-à-bout pour des images haute résolution

Emiel Hoogeboom, Jonathan Heek, Tim Salimans
Diffusion simple : diffusion bout-à-bout pour des images haute résolution
Résumé

Actuellement, l'application des modèles de diffusion dans l'espace pixel d'images haute résolution s'avère difficile. En revanche, les approches existantes se concentrent sur la diffusion dans des espaces de dimension inférieure (diffusion latente), ou adoptent des architectures en cascades comprenant plusieurs niveaux de super-résolution. Le principal inconvénient de ces méthodes réside dans la complexité supplémentaire qu'elles ajoutent au cadre de diffusion.Ce papier vise à améliorer la diffusion débruitante pour les images haute résolution tout en maintenant le modèle aussi simple que possible. Il s'articule autour de la question de recherche suivante : comment entraîner un modèle de diffusion débruitante standard sur des images haute résolution tout en obtenant des performances comparables aux approches alternatives ?Les quatre principales découvertes sont les suivantes : 1) le calendrier de bruit doit être ajusté pour les images haute résolution ; 2) il suffit de mettre à l'échelle une partie spécifique de l'architecture ; 3) l'ajout de dropout à des emplacements précis de l'architecture s'avère bénéfique ; 4) le sous-échantillonnage constitue une stratégie efficace pour éviter des cartes de caractéristiques à haute résolution. En combinant ces techniques simples mais efficaces, nous atteignons un état de l'art en génération d'images parmi les modèles de diffusion, sans recourir à des modificateurs d'échantillonnage, sur ImageNet.

Diffusion simple : diffusion bout-à-bout pour des images haute résolution | Articles de recherche récents | HyperAI