WaveMixSR : Un réseau de neurones à faible consommation de ressources pour la super-résolution d’images

La recherche en super-résolution d’images est récemment dominée par les modèles basés sur les transformateurs, qui nécessitent des ressources computationnelles plus importantes que les réseaux de neurones convolutifs (CNN) en raison de la complexité quadratique de l’attention self-attention. Nous proposons un nouveau réseau neuronal, WaveMixSR, dédié à la super-résolution d’images, fondé sur l’architecture WaveMix et utilisant une transformation en ondelettes discrète 2D pour le mélange des tokens spatiaux. Contrairement aux modèles basés sur les transformateurs, WaveMixSR ne déroule pas l’image sous la forme d’une séquence de pixels ou de patches. Il exploite l’induction des convolutions combinée à la propriété de mélange de tokens sans perte de la transformation en ondelettes afin d’atteindre des performances supérieures tout en nécessitant moins de ressources et de données d’entraînement. Nous comparons les performances de notre réseau avec celles d’autres méthodes de pointe en super-résolution d’images. Nos expériences montrent que WaveMixSR atteint des performances compétitives sur l’ensemble des jeux de données testés, et réalise des résultats de pointe sur le jeu de données BSD100 pour plusieurs tâches de super-résolution. De plus, notre modèle parvient à ces performances en utilisant moins de données d’entraînement et de ressources computationnelles, tout en préservant une haute efficacité en termes de nombre de paramètres par rapport aux modèles actuels de pointe.