HyperAIHyperAI
il y a 2 mois

Modèle de diffusion stimulée pour le débruitage d'images par plongement adaptatif et assemblage

Li, Tong ; Feng, Hansen ; Wang, Lizhi ; Xiong, Zhiwei ; Huang, Hua
Modèle de diffusion stimulée pour le débruitage d'images par plongement adaptatif et assemblage
Résumé

Le débruitage d'images est un problème fondamental en photographie computationnelle, où l'obtention d'une haute qualité perceptive avec une faible distorsion est particulièrement exigeante. Les méthodes actuelles peinent soit à assurer la qualité perceptive, soit subissent une distorsion significative. Récemment, les modèles de diffusion émergents ont atteint des performances de pointe dans diverses tâches et montrent un grand potentiel pour le débruitage d'images. Cependant, l'utilisation des modèles de diffusion pour le débruitage d'images n'est pas simple et nécessite la résolution de plusieurs problèmes critiques. D'une part, l'incohérence des entrées entrave la connexion entre les modèles de diffusion et le débruitage d'images. D'autre part, l'incohérence du contenu entre l'image générée et l'image débruitée souhaitée introduit de la distorsion. Pour résoudre ces problèmes, nous présentons une nouvelle stratégie appelée Modèle de Diffusion pour le Débruitage d'Images (DMID), en comprenant et en repensant le modèle de diffusion sous un angle de débruitage. Notre stratégie DMID comprend une méthode d'emboîtement adaptatif qui intègre l'image bruitée dans un modèle de diffusion non conditionnel pré-entraîné, ainsi qu'une méthode d'assemblage adaptatif qui réduit la distorsion dans l'image débruitée. Notre stratégie DMID atteint des performances de pointe sur les métriques basées sur la distorsion et celles basées sur la perception, tant pour le débruitage d'images Gaussiennes que pour celui du monde réel. Le code est disponible à l'adresse suivante : https://github.com/Li-Tong-621/DMID.