HyperAIHyperAI
vor 17 Tagen

FarSeg++: Vordergrundbewusstes Relationsnetzwerk für die Geospatial-Objektsegmentierung in hochaufgelösten Fernerkundungsbildern

{Liangpei Zhang, Ailong Ma, Junjue Wang, Yanfei Zhong, Zhuo Zheng}
Abstract

Geospatial-Objektsegmentierung, eine grundlegende Aufgabe im Bereich der Erdbeobachtung, leidet stets unter Skalenvariation, einer großen innerklassigen Varianz des Hintergrunds sowie einem Ungleichgewicht zwischen Vorder- und Hintergrund in hochauflösenden (HSR) Fernerkundungsbildern. Generische Methoden zur semantischen Segmentierung konzentrieren sich hauptsächlich auf die Skalenvariation in natürlichen Szenen. Die beiden anderen Probleme werden hingegen in großflächigen Erdbeobachtungsszenarien unzureichend berücksichtigt. In diesem Artikel stellen wir ein vordergrundbewusstes Relationsnetzwerk (FarSeg++) aus den Perspektiven der relationsbasierten, optimierungsbasierten und objektbasierten Vordergrundmodellierung vor, um diese beiden Herausforderungen zu mildern. Aus der Sicht der Relationen verbessert der Vordergrund-Szenen-Relationen-Modul die Unterscheidbarkeit der Vordergrundmerkmale durch kontextuelle Informationen, die mit der Objekt-Szenen-Beziehung korreliert sind. Aus der Sicht der Optimierung wird eine vordergrundbewusste Optimierung vorgeschlagen, die sich während des Trainings auf Vordergrundbeispiele sowie auf schwierige Hintergrundbeispiele konzentriert, um eine ausgewogene Optimierung zu erreichen. Zusätzlich wird aus der Perspektive der Objektivität ein vordergrundbewusster Decoder vorgestellt, um die Objektivitätsrepräsentation zu verbessern und das Problem der Objektivitätsvorhersage zu entschärfen, das durch eine empirische Obergrenzanalyse als Hauptengpass identifiziert wurde. Zudem führen wir eine neue große, hochauflösende Datensammlung für die Segmentierung von Fahrzeugen in städtischen Gebieten ein, um die Wirksamkeit des vorgeschlagenen Ansatzes zu validieren und die Weiterentwicklung der Objektivitätsvorhersage voranzutreiben. Die experimentellen Ergebnisse zeigen, dass FarSeg++ die state-of-the-art-Methoden der generischen semantischen Segmentierung übertrifft und ein besseres Gleichgewicht zwischen Geschwindigkeit und Genauigkeit erreicht.