HyperAIHyperAI

Command Palette

Search for a command to run...

BiFA: Veränderungserkennung in Fernerkundungsbildern mit bitemporaler Merkmalsausrichtung

Zhenwei Shi Zhengxia Zou Chenyang Liu Keyan Chen Chenyao Zhou Hao Chen Haotian Zhang

Zusammenfassung

Trotz des Erfolgs von tiefen Lernverfahren für Veränderungserkennung (Change Detection, CD) weisen ihre bestehenden Mängel in der zeitlichen (Kanal- und räumlichen) sowie multiskaligen Ausrichtung eine unzureichende Fähigkeit zur Minderung externer Faktoren (z. B. Beleuchtungsänderungen und Perspektivunterschiede) auf, die sich aus unterschiedlichen Aufnahmebedingungen bei der CD ergeben. In diesem Artikel wird ein bitemporales Merkmalsausrichtungsmodell (Bitemporal Feature Alignment, BiFA) vorgestellt, das auf leichte Weise eine präzise CD-Karte erzeugt, indem der Einfluss irrelevanter Faktoren reduziert wird. Insbesondere wird für die zeitliche Ausrichtung das bitemporale Interaktionsmodul (Bitemporal Interaction, BI) vorgeschlagen, um die Kanalebene der bitemporalen Bilder auszurichten. Unser Ansatz basiert auf der Intuition, dass die Einbeziehung des BI-Moduls bereits in der Merkmalsextraktion zur Unterdrückung von Störungen wie Beleuchtungsänderungen beitragen kann. Gleichzeitig wird ein auf dem differenziellen Flussfeld basierendes Ausrichtungsmodul (Alignment based on Differential Flow Field, ADFF) vorgeschlagen, um den Versatz zwischen den bitemporalen Bildern explizit zu schätzen und so eine räumliche Ausrichtung zu erreichen, um die unzureichende Registrierung infolge unterschiedlicher Perspektiven zu mindern. Darüber hinaus wird für die multiskalige Ausrichtung ein impliziter neuronaler Ausrichtungsdecoder (Implicit Neural Alignment Decoder, IND) eingeführt, der präzisere Vorhersagemuster erzeugt, indem kontinuierliche Bildrepräsentationen im Koordinatenraum gelernt werden, um eine feinabgestimmte Ausrichtung multiskaliger Merkmale zu erreichen. Unser BiFA übertrifft andere state-of-the-art-Methoden auf sechs Datensätzen (z. B. Verbesserungen von 2,70 %/3,91 % und 2,01 %/2,94 % in F1-Score (F1) und Intersection over Union (IoU) auf den Datensätzen LEVIR+-CD und SYSU-CD, jeweils). Zudem zeigt BiFA eine höhere Robustheit bei der cross-resolution CD. Der Quellcode ist unter https://github.com/zmoka-zht/BiFA verfügbar.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp