HyperAIHyperAI
il y a 2 mois

LWGANet : Un réseau de base léger avec attention de groupe pour les tâches visuelles de télédétection

Lu, Wei ; Chen, Si-Bao ; Ding, Chris H. Q. ; Tang, Jin ; Luo, Bin
LWGANet : Un réseau de base léger avec attention de groupe pour les tâches visuelles de télédétection
Résumé

Les tâches de visualisation par télédétection (RS) ont acquis une importance académique et pratique considérable. Cependant, elles rencontrent de nombreux défis qui entravent l'extraction efficace des caractéristiques, notamment la détection et la reconnaissance d'objets multiples présentant des variations importantes d'échelle au sein d'une seule image. Bien que les stratégies architecturales à double branche ou à plusieurs branches aient été efficaces pour gérer ces variations d'objets, elles ont simultanément entraîné des augmentations considérables des exigences en matière de calcul et du nombre de paramètres. Par conséquent, ces architectures sont moins adaptées au déploiement sur des appareils aux ressources limitées. Les réseaux de neurones légers contemporains, conçus principalement pour les images naturelles, rencontrent fréquemment des difficultés pour extraire efficacement les caractéristiques d'objets à échelles multiples, ce qui compromet leur efficacité dans les tâches de visualisation par télédétection. Cet article présente LWGANet, un réseau de neurones léger spécialisé et adapté aux tâches de visualisation par télédétection, intégrant un nouveau module d'attention de groupe léger (LWGA) conçu pour relever ces défis spécifiques. Le module LWGA, adapté aux images RS, utilise habilement les caractéristiques redondantes pour extraire une large gamme d'informations spatiales, des échelles locales aux échelles globales, sans introduire de complexité supplémentaire ni surcharge computationnelle. Cela facilite l'extraction précise des caractéristiques à travers plusieurs échelles dans un cadre efficace. LWGANet a été rigoureusement évalué sur douze jeux de données couvrant quatre tâches visuelles RS cruciales : classification de scènes, détection d'objets orientés, segmentation sémantique et détection de changements. Les résultats confirment l'applicabilité généralisée de LWGANet ainsi que sa capacité à maintenir un équilibre optimal entre haute performance et faible complexité, atteignant des résultats SOTA (State-of-the-Art) sur divers jeux de données. LWGANet s'est avéré être une nouvelle solution pour les scénarios à ressources limitées nécessitant des capacités robustes de traitement d'images RS.