Command Palette
Search for a command to run...
Réseau d'attention sans paramètre rapide pour une super-résolution efficace
Réseau d'attention sans paramètre rapide pour une super-résolution efficace
Cheng Wan Hongyuan Yu Zhiqi Li Yihang Chen Yajun Zou Yuqing Liu Xuanwu Yin Kunlong Zuo
Résumé
La Résolution d’Images à Partir d’une Seule Image (SISR) est une tâche fondamentale en vision par ordinateur de bas niveau, visant à reconstruire des images haute résolution à partir de leurs versions à basse résolution. Les mécanismes d’attention classiques ont considérablement amélioré les performances de la SISR, mais ils entraînent souvent des structures de réseau complexes et un grand nombre de paramètres, ce qui se traduit par une vitesse d’inférence lente et une taille de modèle importante. Pour remédier à ce problème, nous proposons le réseau d’attention sans paramètre rapide (SPAN), un modèle de SISR hautement efficace qui équilibre le nombre de paramètres, la vitesse d’inférence et la qualité d’image. Le SPAN intègre un mécanisme d’attention novateur et sans paramètre, qui exploite des fonctions d’activation symétriques et des connexions résiduelles pour renforcer l’information à forte contribution et supprimer l’information redondante. Notre analyse théorique démontre l’efficacité de cette conception dans la réalisation de l’objectif du mécanisme d’attention. Nous évaluons le SPAN sur plusieurs benchmarks, montrant qu’il surpasser les modèles existants de super-résolution efficace en termes de qualité d’image et de vitesse d’inférence, atteignant un compromis significatif entre qualité et rapidité. Cela rend le SPAN particulièrement adapté aux applications réelles, notamment dans des scénarios à ressources limitées. Notamment, nous avons remporté la première place sur les deux catégories du défi NTIRE 2024 sur la super-résolution efficace : performance globale et temps d’exécution. Le code et les modèles sont disponibles publiquement à l’adresse suivante : https://github.com/hongyuanyu/SPAN.