Das Drohnenflugzeug-Benchmark: Objekterkennung und -verfolgung

Aufgrund ihrer hohen Mobilität werden unbemannte Fluggeräte (Unmanned Aerial Vehicles, UAVs) in der Computer Vision für zahlreiche wichtige Anwendungen eingesetzt, wobei sie eine höhere Effizienz und Bequemlichkeit bieten als Überwachungskameras mit festem Blickwinkel, -abstand und -bereich. Allerdings wurden bisher nur sehr wenige UAV-Datensätze vorgeschlagen, und diese konzentrieren sich auf spezifische Aufgaben wie visuelle Verfolgung oder Objekterkennung in relativ eingeschränkten Szenarien. Daher ist es von großer Bedeutung, einen unbeschränkten UAV-Referenzdatensatz zu entwickeln, um die entsprechenden Forschungen zu fördern. In dieser Arbeit erstellen wir einen neuen UAV-Referenzdatensatz, der sich auf komplexe Szenarien mit neuen Herausforderungen konzentriert. Aus 10 Stunden Rohvideos wurden etwa 80.000 repräsentative Frames vollständig annotiert, sowohl mit Begrenzungsrahmen als auch bis zu 14 Arten von Attributen (wie Wetterbedingungen, Flughöhe, Kameraperspektive, Fahrzeugkategorie und Okklusion) für drei grundlegende Computer-Vision-Aufgaben: Objekterkennung, Einzelobjektverfolgung und Mehrfachobjektverfolgung. Anschließend wurde eine detaillierte quantitative Studie unter Verwendung der neuesten Stand-der-Technik-Algorithmen für jede Aufgabe durchgeführt. Die experimentellen Ergebnisse zeigen, dass die aktuellen Stand-der-Technik-Methoden auf unserem Datensatz relativ schlechter abschneiden, aufgrund der neuen Herausforderungen in realen UAV-basierten Szenarien wie hoher Dichte, kleine Objekte und Kamerabewegung. Nach unserem Wissen ist unsere Arbeit das erste Mal, dass solche Probleme in unbeschränkten Szenarien umfassend untersucht werden.