HyperAIHyperAI
il y a 3 mois

MambaIR : Une base simple pour la restauration d’image avec un modèle à espace d’état

Hang Guo, Jinmin Li, Tao Dai, Zhihao Ouyang, Xudong Ren, Shu-Tao Xia
MambaIR : Une base simple pour la restauration d’image avec un modèle à espace d’état
Résumé

Les dernières années ont été marquées par des avancées significatives dans le domaine du restauration d’images, essentiellement grâce au développement des réseaux neuronaux profonds modernes, tels que les réseaux de neurones convolutifs (CNN) et les modèles Transformer. Toutefois, les architectures de restauration existantes rencontrent souvent un dilemme entre un champ réceptif global et une efficacité computationnelle, ce qui limite leur application pratique. Récemment, le modèle à espace d’état structuré sélectif, en particulier sa version améliorée Mamba, a montré un grand potentiel pour modéliser les dépendances à longue portée avec une complexité linéaire, offrant ainsi une voie pour résoudre ce dilemme. Toutefois, la version standard de Mamba fait face à certains défis dans les tâches de vision basse niveau, notamment le oubli local des pixels et la redondance canal. Dans ce travail, nous proposons une base simple mais efficace, nommée MambaIR, qui intègre à la fois une amélioration locale et une attention sur les canaux afin d’améliorer le modèle Mamba original. Grâce à cette approche, MambaIR exploite la similarité locale entre les pixels et réduit la redondance canal. Des expériences étendues démontrent l’efficacité de notre méthode : par exemple, MambaIR surpasser SwinIR jusqu’à 0,45 dB dans la restauration d’images (image super-resolution), tout en utilisant un coût computationnel similaire et en offrant un champ réceptif global. Le code est disponible à l’adresse suivante : \url{https://github.com/csguoh/MambaIR}.

MambaIR : Une base simple pour la restauration d’image avec un modèle à espace d’état | Articles de recherche | HyperAI