T-UNet : Triplet UNet pour la détection de changements dans les images satellites à haute résolution

La détection de changements dans les images par télédétection vise à identifier les différences entre des images acquises à des moments différents dans la même région. Elle est largement utilisée dans des domaines tels que la gestion des terres, la surveillance environnementale, l’évaluation des catastrophes, etc. Actuellement, la plupart des méthodes de détection de changements reposent sur une architecture de réseau de type Siamese ou une architecture de fusion précoce (early fusion, EF). L’architecture Siamese se concentre sur l’extraction des caractéristiques des objets aux différentes époques, mais elle néglige l’information relative aux changements, ce qui entraîne des fausses alertes et des détections manquées. L’architecture EF, quant à elle, extrait les caractéristiques après fusion des images issues de différentes phases, mais ignore l’importance des caractéristiques des objets aux différentes époques pour la détection des détails de changement, rendant difficile la précision de la localisation des contours des objets modifiés. Pour résoudre ces limitations et obtenir des résultats plus précis, nous proposons un nouveau réseau, appelé Triplet UNet (T-UNet), basé sur un encodeur à trois branches, capable d’extraire simultanément les caractéristiques des objets et celles des changements entre les images pré- et post-épisode grâce à un encodeur en triplet. Pour permettre une interaction et une fusion efficaces des caractéristiques extraites par les trois branches de l’encodeur en triplet, nous introduisons un module de prise en compte croisée espace-spectre à plusieurs branches (MBSSCA). Dans la phase de décodage, nous intégrons les mécanismes d’attention sur les canaux (CAM) et l’attention spatiale (SAM) afin d’exploiter pleinement les informations texturales détaillées provenant des couches superficielles et les informations sémantiques de localisation issues des couches profondes.