LWGANet: Ein leichtgewichtiger Gruppen-Attention-Backbone für Fernerkundungsaufgaben

Fernerkundungsaufgaben (Remote Sensing, RS) haben in wissenschaftlichen und praktischen Kontexten erhebliche Bedeutung gewonnen. Sie stoßen jedoch auf zahlreiche Herausforderungen, die eine effektive Merkmalsextraktion erschweren, darunter die Erkennung und Identifizierung von mehreren Objekten mit erheblichen Skalenvariationen innerhalb eines einzelnen Bildes. Obwohl frühere Zweig- oder Mehrzweig-Architekturstrategien bei der Bewältigung dieser Objektvarianzen erfolgreich waren, führten sie gleichzeitig zu erheblichen Anstiegen der Rechenanforderungen und des Parameterbestands. Dies macht diese Architekturen für den Einsatz auf ressourcenbeschränkten Geräten weniger geeignet. Moderne leichte Backbone-Netze, die hauptsächlich für natürliche Bilder entwickelt wurden, haben oft Schwierigkeiten, Merkmale aus Objekten mit unterschiedlichen Skalen effektiv zu extrahieren. Dies beeinträchtigt ihre Effizienz in RS-Fernerkundungsaufgaben.In diesem Artikel wird LWGANet vorgestellt, ein spezialisiertes leichtes Backbone-Netzwerk, das für RS-Fernerkundungsaufgaben optimiert ist. Es integriert ein neuartiges leichtiges Gruppenaufmerksamkeitsmodul (Lightweight Group Attention, LWGA), das darauf abzielt, diese spezifischen Herausforderungen zu bewältigen. Das LWGA-Modul, das auf RS-Bildern zugeschnitten ist, nutzt redundant vorhandene Merkmale geschickt, um eine breite Palette räumlicher Informationen von lokalen bis hin zu globalen Skalen zu extrahieren, ohne zusätzliche Komplexität oder Rechenaufwand einzuführen. Dies ermöglicht eine präzise Merkmalsextraktion über verschiedene Skalen innerhalb eines effizienten Rahmens.LWGANet wurde anhand von zwölf Datensätzen streng evaluiert, die vier wichtige RS-Fernerkundungsaufgaben abdecken: Szenerkenntnis (scene classification), orientierte Objekterkennung (oriented object detection), semantische Segmentierung (semantic segmentation) und Änderungsidentifizierung (change detection). Die Ergebnisse bestätigen die weitreichende Anwendbarkeit von LWGANet sowie seine Fähigkeit, einen optimalen Kompromiss zwischen hoher Leistungsfähigkeit und geringer Komplexität zu wahren. LWGANet erreicht state-of-the-art-Ergebnisse in verschiedenen Datensätzen und stellt sich als innovative Lösung für ressourcenbegrenzte Szenarien heraus, die robuste RS-Bildverarbeitungskapazitäten erfordern.