D-LinkNet: LinkNet mit vortrainiertem Encoder und dilatierten Convolutionen für die Straßenerkennung in hochauflösenden Satellitenbildern
{Ming Wu Chuang Zhang Lichen Zhou}

Abstract
Die Extraktion von Straßen ist eine grundlegende Aufgabe im Bereich der Fernerkundung und hat in den letzten zehn Jahren ein besonders intensives Forschungsfeld darstellen. In diesem Artikel stellen wir ein neuronales Netzwerk zur semantischen Segmentierung vor, namens D-LinkNet, das eine Encoder-Decoder-Architektur, dilatierte Faltung (dilated convolution) und einen vortrainierten Encoder für die Aufgabe der Straßenextraktion nutzt. Das Netzwerk basiert auf der LinkNet-Architektur und verfügt in seinem zentralen Bereich über dilatierte Faltungsschichten. Die LinkNet-Architektur zeichnet sich durch hohe Recheneffizienz und geringen Speicherverbrauch aus. Dilatierte Faltung ist ein leistungsfähiges Werkzeug, das es ermöglicht, den Empfindlichkeitsbereich (receptive field) von Merkmalspunkten zu vergrößern, ohne die Auflösung der Merkmalskarten zu verringern. Bei der CVPR DeepGlobe 2018 Road Extraction Challenge erreichten wir auf dem Validierungsset und dem Testset jeweils die besten IoU-Werte von 0,6466 und 0,6342.
Benchmarks
| Benchmark | Methodik | Metriken |
|---|---|---|
| road-segementation-on-deepglobe | D-LinkNet | IoU: 0.6412 |
| semantic-segmentation-on-bjroad | D-LinkNet | IoU: 57.96 |
| semantic-segmentation-on-porto | D-LinkNet | IoU: 70.20 |
KI mit KI entwickeln
Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.