Modernisierte Ausbildung von U-Net für die semantische Segmentierung von Luftbildern
{Ivan Gruber Jakub Straka}

Abstract
In diesem Paper stellen wir ein verbessertes Trainingsprotokoll für die U-Net-Architektur zur semantischen Segmentierung von Luftbildern vor. Wir testen unseren Ansatz auf dem anspruchsvollen FLAIR #2-Datensatz. Wir führen eine umfassende Ablationsstudie zur Wirkung verschiedener Komponenten des Ansatzes auf die Gesamtleistung durch. Die Ablationsstudie umfasst einen Vergleich unterschiedlicher Modellbackbones, Bildaugmentierungen, Lernraten-Scheduler, Verlustfunktionen sowie Trainingsverfahren. Zudem schlagen wir ein zweistufiges Trainingsverfahren vor und evaluieren verschiedene Möglichkeiten zur Modellensammlung (Ensemble). Auf Basis der Ergebnisse entwerfen wir das endgültige Setup des Trainingsprotokolls. Dieses finale Setup reduziert den relativen Fehler um etwa 18 % und erreicht eine mIoU von 0,641, was ein neuer Stand der Technik darstellt. Unser Code ist unter folgender Adresse verfügbar: https://github.com/strakaj/U-Net-for-remote-sensing
Benchmarks
| Benchmark | Methodik | Metriken |
|---|---|---|
| semantic-segmentation-on-flair-french-land | Ensemble-04 MiT-0 MiT-1 RNX-1 RNX-2 | mIoU: 64.1 |
KI mit KI entwickeln
Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.