LoveDA: Ein Fernerkundungs-Landbedeckungs-Datensatz für domainspezifische semantische Segmentierung

Deep-Learning-Ansätze haben vielversprechende Ergebnisse bei der Landnutzungskartierung mit hochauflösenden (HSR) Daten aus der Fernerkundung erzielt. Allerdings können städtische und ländliche Szenen völlig unterschiedliche geographische Landschaften aufweisen, und die geringe Verallgemeinerungsfähigkeit dieser Algorithmen behindert die Erstellung von Karten auf Stadt- oder nationaler Ebene. Die meisten bestehenden HSR-Datensätze fördern hauptsächlich die Forschung zu semantischen Repräsentationen, wodurch die Transferierbarkeit von Modellen weitgehend vernachlässigt wird. In diesem Beitrag stellen wir den Land-cOVEr Domain-Adaptive semantischen Segmentierungsdatensatz (LoveDA) vor, um die Entwicklung semantischer und übertragbarer Lernverfahren voranzutreiben. Der LoveDA-Datensatz enthält 5987 hochauflösende Bilder mit insgesamt 166.768 annotierten Objekten aus drei unterschiedlichen Städten. Im Vergleich zu bestehenden Datensätzen umfasst der LoveDA-Datensatz zwei Domänen (städtisch und ländlich), was erhebliche Herausforderungen mit sich bringt: 1) Objekte in unterschiedlichen Skalen; 2) komplexe Hintergrundproben; und 3) ungleichmäßige Klassenverteilungen. Der LoveDA-Datensatz eignet sich sowohl für die semantische Segmentierung der Landnutzung als auch für Aufgaben des unüberwachten Domänenanpassungsverfahrens (UDA). Dementsprechend haben wir den LoveDA-Datensatz anhand von elf semantischen Segmentierungsverfahren und acht UDA-Methoden evaluiert. Zudem wurden explorative Studien durchgeführt, die sich mit multi-skaligen Architekturen und Strategien, zusätzlicher Hintergrundsupervision sowie der Analyse von Pseudolabels beschäftigen, um diese Herausforderungen zu bewältigen. Der Quellcode und die Daten sind unter https://github.com/Junjue-Wang/LoveDA verfügbar.