Réseaux de Pyramides Laplaciennes Profondes pour une Interpolation Rapide et Précise en Haute Résolution

Les réseaux de neurones convolutionnels ont récemment démontré une reconstruction de haute qualité pour la sur-résolution d'images uniques. Dans cet article, nous proposons le réseau de sur-résolution en pyramide laplacienne (LapSRN) pour reconstruire progressivement les résidus des sous-bandes d'images de haute résolution. À chaque niveau de la pyramide, notre modèle prend en entrée des cartes de caractéristiques à faible résolution, prédit les résidus à haute fréquence et utilise des convolutions transposées pour l'échantillonnage à une résolution plus fine. Notre méthode n'exige pas d'interpolation bicubique comme étape préliminaire et réduit ainsi considérablement la complexité computationnelle. Nous entraînons le LapSRN proposé avec une supervision profonde en utilisant une fonction de perte robuste de type Charbonnier et obtenons une reconstruction de haute qualité. De plus, notre réseau génère des prédictions multi-échelles en une seule passe avant, grâce à la reconstruction progressive, facilitant ainsi les applications respectueuses des ressources. Des évaluations quantitatives et qualitatives approfondies sur des jeux de données de référence montrent que l'algorithme proposé se compare favorablement aux méthodes les plus avancées en termes de vitesse et de précision.