DehazeDCT : Vers un dégâclage non homogène efficace grâce au Transformer à convolution déformable

Le débrouillardage d’images, une tâche fondamentale en vision basse niveau, vise à restaurer la visibilité et les détails à partir d’images brumeuses. De nombreuses méthodes basées sur l’apprentissage profond, grâce à leur puissante capacité d’apprentissage représentationnel, affichent des performances avancées sur le débrouillardage non homogène. Toutefois, ces approches peinent généralement à traiter des images haute résolution (par exemple, 4000 × 6000) en raison de leurs exigences computationnelles importantes. Pour relever ces défis, nous proposons une nouvelle méthode de débrouillardage non homogène reposant sur une architecture inspirée du Transformer à convolution déformable (DehazeDCT). Plus précisément, nous concevons tout d’abord un réseau de type Transformer basé sur la convolution déformable de version 4, offrant des capacités de capture des dépendances à longue portée et d’agrégation spatiale adaptative, tout en assurant une convergence plus rapide et une vitesse de propagation améliorée. Par ailleurs, nous exploitons un Transformer léger inspiré du modèle Retinex afin d’obtenir une correction des couleurs et une réduction de la structure. Les résultats expérimentaux étendus et les performances très compétitives de notre méthode lors du défi NTIRE 2024 sur le débrouillardage dense et non homogène, où elle se classe deuxième parmi les 16 soumissions, démontrent l’efficacité supérieure de la méthode proposée. Le code source est disponible à l’adresse suivante : https://github.com/movingforward100/Dehazing_R.