Résolution d’image par réseaux de projection arrière basés sur l’attention

La super-résolution d’images basée sur l’apprentissage profond (SR) a connu un développement rapide grâce à sa capacité à traiter de grandes quantités de données. En général, plus les réseaux sont profonds et larges, plus ils sont capables d’extraire des cartes de caractéristiques riches et de produire des images SR de qualité remarquable. Toutefois, plus le réseau est complexe, plus le temps de calcul nécessaire pour ses applications pratiques augmente. Il est donc essentiel de concevoir des réseaux simplifiés afin d’assurer une super-résolution d’images efficace. Dans cet article, nous proposons un réseau basé sur l’attention et la projection arrière (ABPN) pour la super-résolution d’images. À l’instar de certaines recherches récentes, nous pensons que le mécanisme de projection arrière peut être amélioré pour la SR. Nous introduisons ainsi des blocs de projection arrière améliorés, capables de mettre à jour itérativement les résidus de caractéristiques à faible et haute résolution. Inspirés par les études récentes sur les modèles d’attention, nous proposons un bloc d’attention spatiale (SAB) pour apprendre les corrélations croisées entre les caractéristiques issues de différentes couches. En s’appuyant sur l’hypothèse selon laquelle une image SR de bonne qualité doit être proche de l’image LR d’origine après redimensionnement, nous proposons un bloc de projection arrière raffiné (RBPB) pour la reconstruction finale. Des expériences étendues sur plusieurs jeux de données publics ainsi que sur les données du défi AIM2019 de super-résolution d’images montrent que le ABPN proposé atteint des performances au niveau de l’état de l’art, voire supérieures, tant sur les mesures quantitatives que qualitatives.