Apprentissage de caractéristiques enrichies via un modèle d’espace d’état sélectif pour un déflouage d’image efficace

Le déflouage d’images vise à restaurer une image de haute qualité à partir de son équivalent flou. L’émergence des réseaux de neurones convolutifs (CNN) et des Transformers a permis des progrès significatifs dans ce domaine. Toutefois, ces méthodes sont souvent confrontées à un dilemme entre l’élimination des perturbations de dégradation à longue portée et le maintien d’une efficacité computationnelle élevée. Bien que le modèle à espace d’état sélectif (SSM) présente un potentiel prometteur pour modéliser les dépendances à longue portée avec une complexité linéaire, il fait face à des défis tels que l’oubli des pixels locaux et la redondance entre canaux. Pour résoudre ce problème, nous proposons un réseau efficace pour le déflouage d’images, exploitant le modèle à espace d’état sélectif afin d’agréger des caractéristiques riches et précises. Plus précisément, nous introduisons un bloc d’agrégation d’informations locales et globales (ALGBlock), conçu pour capturer efficacement et intégrer à la fois les propriétés invariantes locales et les informations non locales. Le bloc ALGBlock se compose de deux modules principaux : un module de capture des caractéristiques locales et globales (CLGF), et un module d’agrégation de caractéristiques (FA). Le module CLGF est constitué de deux branches : la branche globale capture les caractéristiques de dépendance à longue portée via un modèle à espace d’état sélectif, tandis que la branche locale utilise une attention canal simplifiée pour modéliser la connectivité locale, réduisant ainsi l’oubli des pixels locaux et la redondance canal. En outre, nous avons conçu un module FA pour renforcer la composante locale en recalibrant les poids lors de l’agrégation des deux branches, dans le but de favoriser la restauration. Les résultats expérimentaux montrent que la méthode proposée surpasse les approches de pointe sur des benchmarks largement utilisés.