HyperAIHyperAI
il y a 17 jours

SFA-Net : Réseau d’ajustement des caractéristiques sémantiques pour la segmentation d’images satellites

{Sang Jun Lee, Jiwoo Jeong, Gyutae Hwang}
Résumé

Les avancées dans les techniques d'apprentissage profond et de vision par ordinateur ont eu un impact significatif dans le domaine de la télédétection, permettant une analyse efficace des données pour des applications telles que la classification des couvertures du sol et la détection des changements. Les réseaux de neurones convolutifs (CNN) et les architectures de type transformer ont été largement utilisés dans les algorithmes de perception visuelle en raison de leur efficacité pour analyser à la fois les caractéristiques locales et le contexte global. Dans cet article, nous proposons une architecture hybride de type transformer, composée d’un encodeur basé sur CNN et d’un décodeur basé sur transformer. Nous introduisons un module d’ajustement des caractéristiques, conçu pour affiner les cartes de caractéristiques multi-échelles extraites à partir d’un réseau de base EfficientNet. Ces cartes de caractéristiques ajustées sont ensuite intégrées dans le décodeur basé sur transformer afin de réaliser une segmentation sémantique des images de télédétection. Cette architecture encodeur-décodeur proposée est désignée dans cet article sous le nom de réseau d’ajustement des caractéristiques sémantiques (SFA-Net). Pour démontrer l’efficacité de SFA-Net, des expériences approfondies ont été menées sur quatre jeux de données publics de référence : UAVid, ISPRS Potsdam, ISPRS Vaihingen et LoveDA. Le modèle proposé a atteint des performances de pointe sur les jeux de données UAVid, ISPRS Vaihingen et LoveDA pour la segmentation des images de télédétection. Sur le jeu de données ISPRS Potsdam, notre méthode a obtenu une précision comparable à celle des modèles les plus récents, tout en réduisant le nombre de paramètres entraînables de 113,8 millions à 10,7 millions.