ABCNet: Aufmerksamkeitsbasiertes bilaterales Kontextnetzwerk für eine effiziente semantische Segmentierung von hochauflösenden Fernerkundungsbildern

Die semantische Segmentierung von Fernerkundungsbildern spielt eine entscheidende Rolle in der präzisen Landwirtschaft, dem Umweltschutz und der wirtschaftlichen Bewertung. In den letzten Jahren stehen erhebliche Mengen hochauflösender Fernerkundungsbilder für die semantische Segmentierung zur Verfügung. Aufgrund der durch die erhöhte räumliche Auflösung verursachten komplexen Informationsstruktur verwenden derzeit fortschrittlichste Deep-Learning-Algorithmen normalerweise komplexe Netzwerkarchitekturen für die Segmentierung, was typischerweise hohe rechnerische Komplexität mit sich bringt. Insbesondere hängt die herausragende Leistung von Faltungsneuralen Netzen (CNN) stark von fein granularen räumlichen Details (hohe Auflösung) und ausreichender kontextueller Information (große Empfindlichkeitsfelder) ab, wobei beide Aspekte hohe Rechenkosten verursachen. Dies behindert entscheidend ihre Anwendbarkeit und Verfügbarkeit in realen Szenarien, die Echtzeitverarbeitung erfordern. In diesem Artikel stellen wir ein Attentives Bilaterales Kontextuelles Netzwerk (ABCNet) vor – ein Faltungsneuronales Netz (CNN) mit zwei parallelen Zweigen –, das im Vergleich zu aktuellen Spitzenalgorithmen deutlich geringere rechnerische Kosten aufweist, während gleichzeitig eine konkurrenzfähige Genauigkeit erhalten bleibt. Der Quellcode ist unter https://github.com/lironui/ABCNet verfügbar.