Foreground-Aware Relation Network für die Segmentierung geografischer Objekte in hochaufgelösten Fernerkundungsdaten

Die Segmentierung georäumlicher Objekte, als spezielle Aufgabe der semantischen Segmentierung, steht vor der Herausforderung großer Skalenvariationen, größerer innerklassischer Varianz des Hintergrunds und einem Ungleichgewicht zwischen Vorder- und Hintergrund in hochräumlich aufgelösten (HSR) Fernerkundungsdaten. Allerdings konzentrieren sich allgemeine Methoden der semantischen Segmentierung hauptsächlich auf die Skalenvariation in natürlichen Szenen und berücksichtigen die anderen beiden Probleme, die in großen Gebieten der Erdbeobachtung oft auftreten, unzureichend. In dieser Arbeit argumentieren wir, dass diese Probleme auf einem Mangel an Vordergrundmodellierung basieren, und schlagen ein vordergrundbewusstes Relationennetzwerk (FarSeg) vor. Dieses Netzwerk greift aus den Perspektiven relationbasierter und optimierungsbasierter Vordergrundmodellierung an, um die oben genannten beiden Probleme zu lindern. Aus relationsbasierter Perspektive verstärkt FarSeg die Unterscheidbarkeit von Vordergrundmerkmalen durch vordergrundkorrelierte Kontexte, die durch das Lernen von Vordergrund-Szene-Relationen verbunden werden. Gleichzeitig wird aus optimierungsbasierter Perspektive eine vordergrundbewusste Optimierung vorgeschlagen, um während des Trainings sowohl auf Vordergrundbeispiele als auch auf schwierige Hintergrundbeispiele zu fokussieren und so eine ausgewogene Optimierung zu gewährleisten. Die experimentellen Ergebnisse, die mit einem großen Datensatz erzielt wurden, deuten darauf hin, dass die vorgeschlagene Methode den aktuellen allgemeinen Methoden der semantischen Segmentierung überlegen ist und einen besseren Kompromiss zwischen Geschwindigkeit und Genauigkeit erreicht. Der Quellcode ist unter folgender URL verfügbar: \url{https://github.com/Z-Zheng/FarSeg}.