LRNet: Veränderungserkennung in hochaufgelösten Fernerkundungsbildern mittels Strategie der Lokalisierung-gefolgt-von-Verfeinerung

Die Veränderungsdetektion, als Forschungsschwerpunkt im Bereich der Fernerkundung, hat kontinuierliche Entwicklung und Fortschritte erfahren. Dennoch stellt die Differenzierung von Randdetails aufgrund der Komplexität der umgebenden Elemente zwischen Veränderungsbereichen und Hintergrund weiterhin eine erhebliche Herausforderung dar. Bei der Erkennung großer Veränderungsbereiche tritt eine Verschiebung der Ränder auf, während bei kleinen Veränderungsobjekten Ränder verfälschend miteinander verbunden werden. Um diese Probleme zu lösen, wird in diesem Artikel ein neuartiges Netzwerk vorgestellt, das auf der Lokalisierung-then-Verfeinerungs-Strategie basiert und als LRNet bezeichnet wird. LRNet besteht aus zwei Phasen: Lokalisierung und Verfeinerung. In der Lokalisierungsphase extrahiert ein dreigeteilter Encoder gleichzeitig ursprüngliche Bildmerkmale und deren Differenzmerkmale, um die Position jedes Veränderungsbereichs interaktiv zu lokalisieren. Um Informationsverlust während der Merkmalsextraktion zu minimieren, wird ein lernbarer optimaler Pooling-Ansatz (LOP) vorgeschlagen, der den weit verbreiteten Max-Pooling ersetzt. Zudem ist dieser Prozess trainierbar und trägt zur globalen Optimierung des Netzwerks bei. Um Merkmale aus verschiedenen Zweigen effektiv zu interagieren und Veränderungsbereiche unterschiedlicher Größe präzise zu lokalisieren, werden der Veränderungs-Ausrichtungs-Attention-Mechanismus (C2A) und das hierarchische Veränderungs-Ausrichtungs-Modul (HCA) eingeführt. In der Verfeinerungsphase werden die Ergebnisse der Lokalisierungsphase durch die Einschränkung von Veränderungsbereichen und Veränderungsrändern mittels des Kanten-Bereichs-Ausrichtungs-Moduls (E2A) korrigiert. Anschließend verfeinert der Decoder, kombiniert mit den durch C2A in der Lokalisierungsphase verstärkten Differenzmerkmalen, Veränderungsbereiche unterschiedlicher Größe und erreicht schließlich eine präzise Differenzierung der Ränder von Veränderungsbereichen. LRNet übertrifft in Bezug auf umfassende Bewertungsmaße 13 andere state-of-the-art-Methoden und liefert auf den Datensätzen LEVIR-CD und WHU-CD die präzisesten Ergebnisse bei der Differenzierung von Rändern.