Command Palette
Search for a command to run...
Ein räumlich-zeitlicher Aufmerksamkeitsbasiertes Verfahren und ein neuer Datensatz für die Änderungserkennung in Fernerkundungsbildern
Ein räumlich-zeitlicher Aufmerksamkeitsbasiertes Verfahren und ein neuer Datensatz für die Änderungserkennung in Fernerkundungsbildern
Hao Chen Zhenwei Shi
Zusammenfassung
Die Veränderungsdetektion (Change Detection, CD) in Fernerkundungsbildern dient dazu, gewünschte signifikante Veränderungen zwischen zweibildigen Aufnahmen zu identifizieren. Gegeben zwei zeitlich unterschiedlich aufgenommene, aber räumlich registrierte Bilder überwiegen Helligkeitsunterschiede und Registrierungsfehler die tatsächlichen Objektveränderungen. Die Exploration der Beziehungen zwischen verschiedenen räumlich-zeitlichen Pixeln kann die Leistungsfähigkeit von CD-Methoden verbessern. In unserer Arbeit stellen wir ein neuartiges, auf Siamese-Architekturen basierendes räumlich-zeitliches Aufmerksamkeits-Neuronales Netzwerk vor. Im Gegensatz zu früheren Ansätzen, die die zweibildigen Aufnahmen getrennt kodieren, ohne auf nützliche räumlich-zeitliche Abhängigkeiten zurückzugreifen, entwickeln wir eine CD-spezifische Aufmerksamkeitsmechanik, um räumlich-zeitliche Beziehungen zu modellieren. Wir integrieren ein neues CD-Aufmerksamkeitsmodul in den Prozess der Merkmalsextraktion. Unser Aufmerksamkeitsmodul berechnet Aufmerksamkeitsgewichte zwischen beliebigen Pixeln zu verschiedenen Zeiten und Positionen und nutzt diese, um differenziertere Merkmale zu erzeugen. Da Objekte unterschiedliche Skalen aufweisen können, unterteilen wir das Bild in mehrskalige Teilregionen und führen die Aufmerksamkeit innerhalb jeder Teilregion ein. Auf diese Weise können wir räumlich-zeitliche Abhängigkeiten auf verschiedenen Skalen erfassen und dadurch bessere Darstellungen erzeugen, die Objekten unterschiedlicher Größe besser gerecht werden. Zudem präsentieren wir eine neue CD-Datensammlung namens LEVIR-CD, die um zwei Größenordnungen größer ist als andere öffentliche Datensätze in diesem Bereich. LEVIR-CD besteht aus einer großen Anzahl zweibildiger Google Earth-Aufnahmen mit insgesamt 637 Bildpaaren (1024 × 1024) und über 31.000 unabhängig annotierten Veränderungsinstanzen. Unser vorgeschlagenes Aufmerksamkeitsmodul verbessert die F1-Score unseres Baseline-Modells von 83,9 auf 87,3 bei akzeptablem zusätzlichen Rechenaufwand. Experimentelle Ergebnisse auf einer öffentlichen Fernerkundungsdatenbank für CD zeigen, dass unsere Methode mehrere andere state-of-the-art-Verfahren übertrifft.