Großes selektives Kernel-Netzwerk für die Objekterkennung in Fernerkundungsdaten

Neuere Forschungsarbeiten im Bereich der Objektdetektion in Fernerkundungsdaten konzentrieren sich weitgehend auf die Verbesserung der Darstellung orientierter Umrisse, während sie die spezifischen Vorwissen, die in Fernerkundungsszenarien vorliegen, vernachlässigen. Dieses Vorwissen kann von entscheidender Bedeutung sein, da kleine Objekte in Fernerkundungsbildern ohne Berücksichtigung eines ausreichend langen räumlichen Kontexts leicht falsch erkannt werden können, und die erforderlichen langen Kontextinformationen können je nach Objekttyp variieren. In diesem Artikel berücksichtigen wir solche Vorwissen und stellen das Large Selective Kernel Network (LSKNet) vor. LSKNet kann seinen großen räumlichen Empfangsfeld dynamisch anpassen, um den räumlichen Kontext verschiedener Objekte in Fernerkundungsszenarien effektiver zu modellieren. Soweit uns bekannt ist, wird hier erstmals der Einsatz großer und selektiver Kernel-Mechanismen im Bereich der Objektdetektion in Fernerkundung untersucht. Ohne zusätzliche Komplexitäten erreicht LSKNet neue SOTA-Ergebnisse auf etablierten Benchmarks, nämlich HRSC2016 (98,46 % mAP), DOTA-v1.0 (81,85 % mAP) und FAIR1M-v1.0 (47,87 % mAP). Auf Basis einer ähnlichen Technik belegten wir im Jahr 2022 den zweiten Platz beim Greater Bay Area International Algorithm Competition. Der Quellcode ist unter https://github.com/zcablii/Large-Selective-Kernel-Network verfügbar.