Detektion kleiner Objekte in Luftbildern
Die Objektdetektion in Earth Vision hat in den letzten Jahren erhebliche Fortschritte erzielt. Dennoch stellt die Detektion winziger Objekte in Luftbildern weiterhin eine große Herausforderung dar, da diese Objekte nur eine geringe Anzahl an Pixeln enthalten und leicht mit dem Hintergrund verwechselt werden können. Um die Forschung zur Detektion winziger Objekte in Luftbildern voranzutreiben, präsentieren wir ein neues Datenset namens AI-TOD (Tiny Object Detection in Aerial Images). Genauer gesagt umfasst AI-TOD 700.621 Objektinstanzen über acht Kategorien hinweg in 28.036 Luftbildern. Im Vergleich zu bestehenden Objektdetektionsdatensätzen für Luftbilder beträgt die durchschnittliche Objektgröße in AI-TOD etwa 12,8 Pixel – dies ist deutlich kleiner als bei anderen Datensätzen. Um eine Benchmark für die Detektion winziger Objekte in Luftbildern zu etablieren, evaluieren wir state-of-the-art-Objektdetektoren auf unserem AI-TOD-Datenset. Die experimentellen Ergebnisse zeigen, dass die direkte Anwendung dieser Ansätze auf AI-TOD suboptimale Detektionsergebnisse liefert, wodurch neue, spezialisierte Detektoren für die Detektion winziger Objekte notwendig werden. Daher schlagen wir ein mehrfach zentriertes Lernnetzwerk (M-CenterNet) vor, um die Lokalisierungsgenauigkeit bei der Detektion winziger Objekte zu verbessern. Die experimentellen Ergebnisse belegen einen signifikanten Leistungsfortschritt gegenüber bestehenden Ansätzen.