DecoupleNet: Ein leichtgewichtiger Backbone-Netzwerk mit effizienter Merkmalsentkoppelung für visuelle Aufgaben in der Fernerkundung
Im Bereich der Computer Vision (CV) bleibt die Balance zwischen Geschwindigkeit und Genauigkeit eine bedeutende Herausforderung. In jüngster Zeit konzentrieren sich Bemühungen auf die Entwicklung leichtgewichtiger Netzwerke, die die rechnerische Effizienz und die Merkmalsextraktion optimieren. In Fernerkundungs-(RS-)Bildern, in denen die Erkennung kleiner und mehrskaliger Objekte entscheidend ist, erweisen sich diese Netzwerke jedoch oft als leistungsschwach. Um diese Herausforderungen zu bewältigen, wird DecoupleNet vorgestellt – ein innovatives, leichtgewichtiges Hauptnetzwerk, speziell für visuelle RS-Aufgaben in ressourcenbeschränkten Umgebungen konzipiert. DecoupleNet integriert zwei zentrale Module: das Feature-Integration-Downsampling-(FID)-Modul und das Multibranch-Feature-Decoupling-(MBFD)-Modul. Das FID-Modul bewahrt Merkmale kleiner Objekte während des Downsamplings, während das MBFD-Modul die Merkmalsdarstellung kleiner und mehrskaliger Objekte durch einen neuartigen Decoupling-Ansatz verbessert. Umfassende Evaluierungen an drei RS-Visualisierungsaufgaben zeigen, dass DecoupleNet im Vergleich zu bestehenden leichtgewichtigen Netzwerken eine überlegene Balance zwischen Genauigkeit und rechnerischer Effizienz erreicht. Auf dem NWPU-RESISC45-Datensatz für Klassifikation erzielt DecoupleNet eine Top-1-Accuracy von 95,30 %, was 2 Prozentpunkte mehr als FasterNet beträgt, bei geringerem Parameterumfang und niedrigerer rechnerischer Belastung. Bei Objekterkennungsaufgaben mit dem DOTA 1.0-Testset erreicht DecoupleNet eine Genauigkeit von 78,04 %, was 0,69 Prozentpunkte über ARC-R50 liegt. Für die semantische Segmentierung auf dem LoveDA-Testset erzielt DecoupleNet eine Genauigkeit von 53,1 %, was 0,70 Prozentpunkte über UnetFormer hinausgeht. Diese Ergebnisse eröffnen neue Wege zur Weiterentwicklung der RS-Bildanalyse auf ressourcenbeschränkten Geräten und schließen eine zentrale Lücke im Forschungsfeld. Der Quellcode und vortrainierte Modelle sind öffentlich unter https://github.com/lwCVer/DecoupleNet verfügbar.