CFC-Net: Ein kritisches Merkmals-Aufnahmenetzwerk für objektorientierte Erkennung beliebiger Ausrichtung in Fernerkundungsbildern

Die Objektdetektion in optischen Fernerkundungsbildern ist eine wichtige und herausfordernde Aufgabe. In den letzten Jahren haben Methoden auf Basis von Faltungsneuronalen Netzwerken erhebliche Fortschritte erzielt. Aufgrund der starken Variationen in Objektgröße, Seitenverhältnis und beliebiger Orientierung bleibt die Detektionsleistung jedoch schwer weiter zu verbessern. In diesem Artikel untersuchen wir die Rolle diskriminativer Merkmale bei der Objektdetektion und stellen ein kritisches Merkmalsaufnahmenetzwerk (Critical Feature Capturing Network, CFC-Net) vor, das die Detektionsgenauigkeit auf drei Ebenen verbessert: durch die Schaffung leistungsfähiger Merkmalsrepräsentationen, die Verfeinerung vorgegebener Anchor-Regionen und die Optimierung der Label-Zuweisung. Konkret trennen wir zunächst die Klassifikations- und Regressionsmerkmale voneinander und konstruieren anschließend robuste kritische Merkmale, die jeweils den spezifischen Aufgaben angepasst sind, mittels des Polarisation-Aufmerksamkeits-Moduls (Polarization Attention Module, PAM). Unter Verwendung der extrahierten diskriminativen Regressionsmerkmale führt das Modul zur Verfeinerung rotierender Anchor-Regionen (Rotation Anchor Refinement Module, R-ARM) eine präzise Lokalisationsverbesserung der vorgegebenen horizontalen Anchor-Regionen durch, um optimierte rotierende Anchor-Regionen zu erzeugen. Anschließend wird die dynamische Anchor-Lernstrategie (Dynamic Anchor Learning, DAL) eingeführt, um adaptiv hochwertige Anchor-Regionen basierend auf ihrer Fähigkeit zur Erfassung kritischer Merkmale auszuwählen. Das vorgeschlagene Framework ermöglicht eine stärkere semantische Repräsentation von Objekten in Fernerkundungsbildern und erreicht eine hochleistungsfähige Echtzeit-Objektdetektion. Experimentelle Ergebnisse auf drei Fernerkundungs-Datensätzen – HRSC2016, DOTA und UCAS-AOD – zeigen, dass unsere Methode gegenüber vielen state-of-the-art-Verfahren überlegene Detektionsleistung erzielt. Der Quellcode und die Modelle sind unter https://github.com/ming71/CFC-Net verfügbar.