HyperAIHyperAI
il y a 17 jours

WaveMixSR-V2 : Amélioration de la super-résolution avec une efficacité accrue

Pranav Jeevan, Neeraj Nixon, Amit Sethi
WaveMixSR-V2 : Amélioration de la super-résolution avec une efficacité accrue
Résumé

Les avancées récentes en super-résolution à partir d'une seule image ont été principalement alimentées par les architectures de mélanges de tokens et les modèles transformer. WaveMixSR a mis en œuvre l'architecture WaveMix, en utilisant une transformation en ondelettes discrète bidimensionnelle pour le mélange des tokens spatiaux, atteignant des performances supérieures dans les tâches de super-résolution tout en offrant une efficacité remarquable en ressources. Dans ce travail, nous proposons une version améliorée de l'architecture WaveMixSR, en (1) remplaçant la couche de convolution transposée traditionnelle par une opération de pixel shuffle, et en (2) intégrant une architecture à plusieurs étapes adaptée aux tâches de haute résolution (×4). Nos expérimentations montrent que notre modèle amélioré, WaveMixSR-V2, surpasse d'autres architectures dans plusieurs tâches de super-résolution, atteignant un état de l'art sur le jeu de données BSD100, tout en consommant moins de ressources, en affichant une meilleure efficacité en paramètres, une latence réduite et un débit plus élevé. Notre code est disponible à l’adresse suivante : https://github.com/pranavphoenix/WaveMixSR.

WaveMixSR-V2 : Amélioration de la super-résolution avec une efficacité accrue | Articles de recherche récents | HyperAI