HyperAIHyperAI
vor 11 Tagen

CDMamba: Einbeziehung lokaler Hinweise in Mamba für die binäre Änderungserkennung in Fernerkundungsbildern

Haotian Zhang, Keyan Chen, Chenyang Liu, Hao Chen, Zhengxia Zou, Zhenwei Shi
CDMamba: Einbeziehung lokaler Hinweise in Mamba für die binäre Änderungserkennung in Fernerkundungsbildern
Abstract

Kürzlich hat die Mamba-Architektur, die auf Zustandsraummodellen basiert, in einer Reihe von Aufgaben des natürlichen Sprachverstehens bemerkenswerte Leistungen gezeigt und rasch auf Aufgaben der Veränderungsdetektion in der Fernerkundung (Change Detection, CD) übertragen werden. Allerdings verstärken die meisten bestehenden Ansätze den globalen Wahrnehmungsfeld durch direkte Modifikation des Scanning-Modus von Mamba, wobei die entscheidende Rolle lokaler Informationen in dichten Vorhersageaufgaben (z. B. binäre CD) vernachlässigt wird. In diesem Artikel stellen wir ein Modell namens CDMamba vor, das globalen und lokalen Merkmalen effektiv kombiniert, um binäre CD-Aufgaben zu bewältigen. Konkret wird der Scaled Residual ConvMamba (SRCM)-Block vorgeschlagen, um die Fähigkeit von Mamba zur Extraktion globaler Merkmale mit der Fähigkeit der Faltung zur Verstärkung lokaler Details zu kombinieren, um das Problem zu lösen, dass aktuelle Mamba-basierte Methoden an feinen Details leiden und in dichten Vorhersageaufgaben eine präzise Detektion erschweren. Darüber hinaus wird unter Berücksichtigung der spezifischen Anforderungen an die Interaktion zwischen zweitemporalen Merkmalen für CD der Adaptive Global Local Guided Fusion (AGLGF)-Block vorgestellt, der die zweitemporale Interaktion dynamisch unter Leitung anderer zeitlicher globaler/lokaler Merkmale fördert. Unser Ansatz basiert auf der Intuition, dass mit der Anleitung durch andere zeitliche Merkmale differenziertere Veränderungsmerkmale erzielt werden können. Umfangreiche Experimente an fünf Datensätzen zeigen, dass unser vorgeschlagenes CDMamba mit den aktuellen Methoden vergleichbar ist (z. B. Verbesserung der F1-/IoU-Scores um 2,10 %/3,00 % und 2,44 %/2,91 % auf LEVIR+CD und CLCD, jeweils). Der Quellcode ist unter https://github.com/zmoka-zht/CDMamba öffentlich zugänglich.

CDMamba: Einbeziehung lokaler Hinweise in Mamba für die binäre Änderungserkennung in Fernerkundungsbildern | Neueste Forschungsarbeiten | HyperAI