Pixelbasierte Segmentierung von Luftbildern

Aerial-Bilder können weltweit für bedeutende Anwendungen genutzt werden. Dennoch bleibt die Analyse dieser Daten mittels neuronalen Netzwerkearchitekturen hinter dem aktuellen Stand der Technik auf etablierten Datensätzen wie PASCAL VOC, Cityscapes und CamVid zurück. In diesem Artikel schließen wir die Leistungs-Lücke zwischen diesen gängigen Datensätzen und aerialer Bildmaterialien. Bisher wurde nur wenig Forschung zu aerialen Bildern mit state-of-the-art neuronalen Netzwerken in einem Multi-Klassen-Szenario durchgeführt. Unsere Experimente zu Daten-Augmentation, Normalisierung, Bildgröße und Verlustfunktionen liefern wertvolle Erkenntnisse über eine hochleistungsfähige Konfiguration für Segmentsierungsaufgaben auf aerialen Bildern. Unser Ansatz, basierend auf der state-of-the-art-Architektur DeepLabv3+ Xception65, erreicht auf dem DroneDeploy-Validierungssatz eine mittlere Intersection-over-Union (mIOU) von 70 %. Mit diesem Ergebnis übertrifft unsere Methode deutlich die aktuell verfügbare state-of-the-art-Leistung auf dem Validierungssatz (65 % mIOU) um 5 Prozentpunkte. Zudem gibt es, soweit uns bekannt ist, bisher kein mIOU-Benchmark für den Testset. Daher schlagen wir zudem einen neuen Benchmark für den DroneDeploy-Testset vor, basierend auf der bestperformenden DeepLabv3+ Xception65-Architektur, mit einer mIOU-Score von 52,5 %.