Command Palette
Search for a command to run...
Ein Verfahren zur Detektion kleiner beweglicher Objekte in UAV-Videos
Ein Verfahren zur Detektion kleiner beweglicher Objekte in UAV-Videos
and Zdenka Babić Nikola Kezić Janja Filipi Vedran Jovanović Mario Muštra Vladimir Risojević Vladan Stojnić
Zusammenfassung
Die Erkennung kleiner beweglicher Objekte ist ein wichtiger Forschungsbereich mit Anwendungen wie der Überwachung fliegender Insekten, der Untersuchung ihres Nahrungssuchverhaltens, der Nutzung von Insektenbestäubern zur Überwachung der Blüte und Bestäubung von Kulturpflanzen, der Überwachung von Honigbienenkolonien sowie der Verfolgung der Bewegung von Honigbienen. Aufgrund der fehlenden charakteristischen Form- und Texturmerkmale kleiner Objekte zeigt die direkte Anwendung moderner Objekterkennungsmethoden auf Basis von Faltungsneuralen Netzen (CNNs) jedoch erheblich geringere Leistung. In diesem Artikel stellen wir eine Methode zur Erkennung kleiner beweglicher Objekte in Videos vor, die mit unbemannten Luftfahrzeugen (UAVs) unter Verwendung herkömmlicher Videokameras aufgenommen wurden. Die zentralen Schritte unseres Ansatzes sind die Video-Stabilisierung, die Schätzung und Subtraktion des Hintergrunds, die Segmentierung einzelner Frames mittels CNN und die Anwendung einer Schwellwertbildung auf die segmentierten Frames. Für die Ausbildung eines CNNs ist jedoch eine große, manuell beschriftete Datensammlung erforderlich. Die manuelle Beschriftung kleiner beweglicher Objekte in Videos ist jedoch äußerst schwierig und zeitaufwendig, und derzeit existieren keine solchen beschrifteten Datensätze. Um dieses Problem zu umgehen, schlagen wir vor, ein CNN mithilfe synthetischer Videos zu trainieren, die durch Hinzufügen kleiner, blobartiger Objekte zu Videosequenzen mit realen Hintergründen generiert werden. Die experimentellen Ergebnisse zur Erkennung fliegender Honigbienen zeigen, dass der vorgeschlagene Ansatz – durch die Kombination klassischer Methoden der Computer Vision mit CNNs sowie durch den Einsatz synthetischer Trainingsdatensätze – die Probleme, die bei der direkten Anwendung von CNNs auf dieses Problem auftreten, überwindet und in Tests an realen Videos durchschnittlich einen F1-Score von 0,86 erreicht.