NAFSSR : Amélioration de la Résolution des Images Stéréoscopiques à l'Aide de NAFNet

La super-résolution d'images stéréoscopiques vise à améliorer la qualité des résultats de super-résolution en utilisant les informations complémentaires fournies par les systèmes binoculaires. Pour obtenir des performances raisonnables, la plupart des méthodes se concentrent sur une conception minutieuse de modules, de fonctions de perte, etc., afin d'exploiter les informations provenant d'une autre vue. Cela a pour effet secondaire d'augmenter la complexité du système, rendant difficile pour les chercheurs l'évaluation de nouvelles idées et la comparaison des méthodes. Ce papier s'appuie sur un modèle puissant et simple de restauration d'images, NAFNet, pour l'extraction de caractéristiques mono-vue et le prolonge en ajoutant des modules d'attention croisée pour fusionner les caractéristiques entre les vues afin de s'adapter aux scénarios binoculaires. La ligne de base proposée pour la super-résolution d'images stéréoscopiques est notée NAFSSR. De plus, des stratégies d'entraînement et de test sont proposées pour exploiter pleinement les performances de NAFSSR. Des expériences approfondies démontrent l'efficacité de notre méthode. En particulier, NAFSSR surpasses les méthodes les plus avancées sur les jeux de données KITTI 2012, KITTI 2015, Middlebury et Flickr1024. Avec NAFSSR, nous avons remporté le premier prix du Défi NTIRE 2022 sur la Super-résolution d'Images Stéréoscopiques. Les codes et modèles seront mis à disposition sur https://github.com/megvii-research/NAFNet.