Un réseau à attention résiduelle multi-échelle en ensemble (EMRA-net) pour le débrouillardage d’images
La débroussaille d’images vise à restaurer une image nette à partir d’une image trouble, un problème difficile et persistant depuis longtemps. Dans cet article, nous proposons un réseau neuronal à attente résiduelle multi-échelle en ensemble (EMRA-Net) afin de générer directement une image nette, composé de deux parties : un réseau convolutif à attente résiduelle à trois échelles (TRA-CNN), et un réseau convolutif à attente en ensemble (EA-CNN). Dans le TRA-CNN, nous utilisons la transformation en ondelettes pour obtenir des images sous-échantillonnées, au lieu de méthodes classiques de sous-échantillonnage spatial telles que le sous-échantillonnage par plus proche voisin ou la convolution à pas fixe. Grâce à la transformation en ondelettes, nous évitons la perte de détails texturaux dans l’image. En outre, dans chaque branche d’échelle, des modules Res2Net sont connectés en série afin d’exploiter pleinement les caractéristiques hiérarchiques issues des images troubles d’origine, et un mécanisme d’attention sur les canaux est introduit pour concentrer l’attention sur l’information dimensionnelle des canaux. Enfin, un EA-CNN est proposé pour fusionner les images grossières produites par le TRA-CNN afin d’obtenir une image nette raffinée. Des expériences étendues sur des jeux de données synthétiques standards et sur un jeu de données réel à images troubles démontrent que le EMRA-Net proposé surpasser les méthodes de pointe précédentes, tant sur le plan de la perception visuelle subjective que des métriques d’évaluation quantitative de la qualité d’image.