HyperAIHyperAI
il y a 17 jours

Ensemble U-Net pour une segmentation sémantique améliorée dans les images satellites

{Ivan Kitanovski, Suzana Loshkovska, Vlatko Spasev, Ivica Dimitrovski}
Résumé

La segmentation sémantique des images satellites constitue une tâche fondamentale tant dans le domaine de la télédétection que dans celui de la vision par ordinateur. Son objectif est de produire une carte de segmentation pixel par pixel exhaustive d'une image, en attribuant une étiquette spécifique à chaque pixel. Cette opération permet une analyse approfondie et une meilleure compréhension de la surface terrestre. Dans cet article, nous proposons une méthode visant à améliorer les performances de la segmentation sémantique en exploitant un ensemble de modèles U-Net basés sur trois architectures principales différentes : le Multi-Axis Vision Transformer, le ConvFormer et l'EfficientNet. Les cartes de segmentation finales sont générées par une méthode d'agrégation basée sur la moyenne géométrique, qui exploite les représentations diversifiées apprises par chaque architecture principale. L'efficacité des modèles U-Net de base ainsi que de l'ensemble proposé est évaluée sur plusieurs jeux de données couramment utilisés pour les tâches de segmentation sémantique dans les images satellites, notamment LandCover.ai, LoveDA, INRIA, UAVid et ISPRS Potsdam. Nos résultats expérimentaux démontrent que l'approche proposée atteint des performances de pointe, illustrant ainsi son efficacité et sa robustesse dans la capture précise des informations sémantiques intégrées dans les images satellites.