HyperAIHyperAI

Command Palette

Search for a command to run...

vor 4 Monaten

Multiattention-Netzwerk für die semantische Segmentierung von hochaufgelösten Fernerkundungsbildern

{Peter M. Atkinson Libo Wang Jianlin Su Chenxi Duan Ce Zhang Shunyi Zheng Rui Li}

Abstract

Die semantische Segmentierung von Fernerkundungsbildern spielt eine entscheidende Rolle in einer Vielzahl von Anwendungen, darunter die Bewirtschaftung von Landressourcen, die Überwachung der Biosphäre und die Stadtplanung. Obwohl die Genauigkeit der semantischen Segmentierung in Fernerkundungsbildern durch tiefe Faltungsneuronale Netze erheblich gesteigert wurde, bestehen in herkömmlichen Modellen mehrere Einschränkungen. Erstens führt bei Encoder-Decoder-Architekturen wie U-Net die Nutzung von Multiskalen-Features zu einer Unterutilisierung von Informationen, da niedrigstufige und hochstufige Merkmale direkt ohne weitere Verbesserung zusammengefügt werden. Zweitens werden langreichweitige Abhängigkeiten in Merkmalskarten unzureichend erforscht, was zu suboptimalen Merkmalsdarstellungen für jede semantische Klasse führt. Drittens behindert selbst die Einführung und Nutzung des Dot-Product-Attention-Mechanismus zur Modellierung langreichweitiger Abhängigkeiten die praktische Anwendung von Attention in Szenarien mit großskaligen Eingaben, da Attention hohe zeitliche und räumliche Anforderungen stellt. In diesem Artikel wird ein Multi-Attention-Netzwerk (MANet) vorgestellt, um diese Probleme zu lösen, indem kontextuelle Abhängigkeiten durch mehrere effiziente Attention-Module erfasst werden. Es wird ein neuartiger Attention-Mechanismus namens Kernel Attention mit linearer Komplexität vorgeschlagen, um die hohen Rechenanforderungen von Attention zu verringern. Auf Basis von Kernel Attention und Kanal-Attention integrieren wir lokale Merkmalskarten, die durch ResNet-50 extrahiert wurden, mit ihren entsprechenden globalen Abhängigkeiten und gewichten die miteinander verbundenen Kanäle adaptiv neu. Numerische Experimente an zwei großen, hochaufgelösten Fernerkundungsdatensätzen belegen die überlegene Leistung des vorgeschlagenen MANet. Der Quellcode ist unter https://github.com/lironui/Multi-Attention-Network verfügbar.

Benchmarks

BenchmarkMethodikMetriken
semantic-segmentation-on-isprs-potsdamMANet
Overall Accuracy: 91.318
semantic-segmentation-on-isprs-vaihingenMANet
Overall Accuracy: 90.963

KI mit KI entwickeln

Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.

KI-Co-Coding
Sofort einsatzbereit GPUs
Beste Preise
Jetzt starten

Hyper Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp