Réseau à attention résiduelle double pour le débruitage d’images

Dans le domaine du débruitage d’images, les réseaux de neurones convolutifs profonds (CNN) parviennent à obtenir de bons résultats pour éliminer le bruit spatialment invariant. Toutefois, de nombreux de ces réseaux peinent à traiter efficacement le bruit réel (c’est-à-dire le bruit spatialment variant) généré lors de l’acquisition ou de la transmission d’images, ce qui limite fortement leur application dans les tâches pratiques de débruitage. Au lieu d’augmenter continuellement la profondeur du réseau, de nombreux chercheurs ont montré que l’élargissement de la largeur des réseaux peut également constituer une voie efficace pour améliorer les performances du modèle. Il a également été confirmé que le filtrage des caractéristiques peut renforcer la capacité d’apprentissage des modèles. Dans ce travail, nous proposons un nouveau réseau résiduel à deux branches à attention (DRANet) pour le débruitage d’images, combinant les avantages d’une architecture large et d’un apprentissage des caractéristiques guidé par l’attention. Le DRANet proposé comporte deux branches parallèles distinctes, capables de capturer des caractéristiques complémentaires afin d’améliorer la capacité d’apprentissage du modèle. Nous avons conçu un nouveau bloc d’attention résiduelle (RAB) pour la branche supérieure et un bloc hybride résiduel à dilatation à attention (HDRAB) pour la branche inférieure. Le RAB et le HDRAB permettent de capturer des caractéristiques locales riches grâce à plusieurs connexions de saut entre différentes couches convolutives, tandis que les modules d’attention résiduelle éliminent les caractéristiques peu pertinentes. Par ailleurs, les connexions de saut longues au sein de chaque branche, ainsi que la fusion globale des caractéristiques entre les deux branches parallèles, permettent également la capture de caractéristiques globales. En outre, le DRANet utilise des opérations de sous-échantillonnage et des convolutions dilatées afin d’élargir le champ réceptif, ce qui lui confère la capacité de capter davantage d’informations contextuelles dans l’image. Des expérimentations étendues montrent que, par rapport à d’autres méthodes de débruitage de pointe, le DRANet obtient des performances compétitives tant pour le débruitage de bruit synthétique que pour celui de bruit réel du monde réel.