IGFNet : Réseau de fusion guidé par l'éclairage pour la compréhension sémantique des scènes à l'aide d'images RGB-Thermiques

La compréhension sémantique de scène est une tâche fondamentale pour les véhicules autonomes. Elle constitue une pierre angulaire pour de nombreuses tâches ultérieures. Dans des conditions d'éclairage défavorables, les images thermiques peuvent fournir des informations complémentaires par rapport aux images RGB. De nombreuses architectures de fusion multimodales ont été proposées pour la compréhension sémantique de scène à partir de données RGB-Thermique. Toutefois, les méthodes actuelles de pointe utilisent simplement des réseaux pour fusionner les caractéristiques entre modalités de manière inexplicable, plutôt que de concevoir une méthode de fusion fondée sur les caractéristiques intrinsèques des images RGB et thermiques. Pour remédier à ce problème, nous proposons IGFNet, un réseau de fusion guidée par l'éclairage pour la compréhension sémantique de scène RGB-Thermique, qui utilise un masque de poids généré par un module d'estimation de l'éclairage afin de pondérer les cartes de caractéristiques RGB et thermiques à différentes étapes. Les résultats expérimentaux montrent que notre réseau surpasser les méthodes de pointe sur le jeu de données MFNet. Notre code est disponible à l'adresse suivante : https://github.com/lab-sun/IGFNet.