DeepMAO : Réseau surcomplet à prise en compte multi-échelle profonde pour la segmentation des bâtiments dans les images satellitaires

La segmentation des bâtiments dans les images aériennes à grande échelle est un défi, en particulier pour les petits bâtiments situés dans des environnements urbains denses et encombrés. Les structures architecturales complexes, présentant des empreintes géométriques extrêmement variées, posent un défi supplémentaire pour la tâche de segmentation des bâtiments dans les images satellitaires. Dans ce travail, nous proposons de relever le défi de la détection et de la segmentation des bâtiments petits et de forme complexe dans les images satellites électro-optiques (EO) et à radar à synthèse d'ouverture (SAR). Nous introduisons une nouvelle architecture, le réseau profond multi-échelle conscient surcomplété (DeepMAO), composé d'une branche surcomplétée, qui se concentre sur les détails fins des structures, et d'une branche sous-complétée (U-Net), chargée de capturer des caractéristiques plus globales et riches en sémantique. Par ailleurs, nous proposons une nouvelle stratégie d’augmentation auto-régulée, nommée « Loss-Mix », visant à améliorer la représentation des pixels mal classés. DeepMAO est simple et efficace pour identifier avec précision les petits bâtiments et ceux de forme géométriquement complexe. Les résultats expérimentaux sur le jeu de données SpaceNet 6, pour les deux modalités EO et SAR, ainsi que sur le jeu de données INRIA, montrent que DeepMAO atteint des performances de segmentation des bâtiments au niveau de l’état de l’art, y compris pour les bâtiments petits et de forme complexe, avec une augmentation négligeable du nombre de paramètres. En outre, la présence de la branche surcomplétée dans DeepMAO contribue efficacement à la gestion du bruit de granulation (speckle) présent dans la modalité SAR.