Réseau de représentation de structure et apprentissage à rétroaction d'incertitude pour le traitement dense de brouillard non uniforme

Peu des méthodes existantes de débrouillardage ou de déhachage d’images prennent en compte les distributions denses et non uniformes de particules, qui surviennent fréquemment dans la fumée, la poussière ou le brouillard. Traiter de telles distributions denses et/ou non uniformes peut s’avérer extrêmement difficile, car l’atténuation due au brouillard et l’effet de lumière aérienne (ou effet de voile) affaiblissent considérablement les informations relatives à la scène arrière-plan dans l’image d’entrée. Pour remédier à ce problème, nous proposons un réseau de représentation structurelle basé sur un apprentissage à retour d’incertitude. Plus précisément, nous extrayons des représentations de caractéristiques à partir d’un module Vision Transformer pré-entraîné (DINO-ViT) afin de restaurer les informations de la scène arrière-plan. Pour guider notre réseau à se concentrer sur les zones de brouillard non uniforme, et ainsi les éliminer de manière appropriée, nous introduisons une méthode d’apprentissage à retour d’incertitude, qui génère des cartes d’incertitude montrant un niveau d’incertitude plus élevé dans les régions à densité de brouillard élevée. Ces cartes peuvent être interprétées comme des cartes d’attention représentant la densité et la distribution inégale du brouillard. À partir de ces cartes d’incertitude, notre réseau itératif affine progressivement la sortie débrouillardée. En outre, afin de faire face à la difficulté d’estimer les couleurs de la lumière atmosphérique, nous exploitons la version en niveaux de gris de l’image d’entrée, qui est moins affectée par les variations de couleur de lumière pouvant être présentes dans l’image d’entrée. Les résultats expérimentaux démontrent l’efficacité de notre méthode, tant sur le plan quantitatif que qualitatif, par rapport aux méthodes de pointe dans la gestion du brouillard ou de la fumée denses et non uniformes.