Réseau d'attention du second ordre pour la super-résolution d'image unique

Récemment, les réseaux de neurones convolutifs profonds (CNN) ont été largement explorés dans le domaine de la super-résolution d’image unique (SISR) et ont obtenu des performances remarquables. Toutefois, la plupart des méthodes actuelles basées sur les CNN se concentrent principalement sur la conception d’architectures plus larges ou plus profondes, tout en négligeant l’exploration des corrélations entre les caractéristiques des couches intermédiaires, ce qui limite leur capacité d’expression. Pour remédier à ce problème, nous proposons dans cet article un réseau d’attention du second ordre (SAN) afin d’améliorer significativement l’expression des caractéristiques et l’apprentissage des corrélations entre celles-ci. Plus précisément, nous introduisons un nouveau module d’attention de canal du second ordre (SOCA), entièrement entraînable, qui ajuste de manière adaptative les caractéristiques par canal en exploitant des statistiques de second ordre des caractéristiques, permettant ainsi des représentations plus discriminantes. Par ailleurs, nous proposons une structure améliorée par des résidus non locaux (NLRG), qui intègre à la fois des opérations non locales pour capturer des informations contextuelles spatiales à longue portée, ainsi que des groupes répétés d’attention résiduelle à source locale (LSRAG) permettant d’apprendre progressivement des représentations de caractéristiques de plus en plus abstraites. Les résultats expérimentaux démontrent l’avantage de notre réseau SAN par rapport aux méthodes les plus avancées de SISR, tant sur les critères quantitatifs que sur la qualité visuelle.