HyperAIHyperAI
vor 18 Tagen

Robust und effiziente Nachverarbeitung für Video-Objektdetektion (REPP)

{Luis Montesano, Alberto Sabater, Ana C. Murillo}
Robust und effiziente Nachverarbeitung für Video-Objektdetektion (REPP)
Abstract

Die Objekterkennung in Videos ist eine zentrale Aufgabe für zahlreiche Anwendungen, darunter die Wahrnehmung im autonomen Fahren, Überwachungssysteme, tragbare Geräte oder IoT-Netzwerke. Die Objekterkennung anhand von Videodaten ist herausfordernder als die Verwendung statischer Bilder, da Fehlern wie Verschmierungen, Verdeckungen oder seltenen Objektposen begegnet werden muss. Derzeitige State-of-the-Art-Lösungen erreichen ihre Leistung entweder durch spezifische Video-Detektoren mit hohem Rechenaufwand oder durch Standard-Bild-Detektoren in Kombination mit schnellen Nachverarbeitungsalgorithmen. In dieser Arbeit wird ein neuartiger Nachverarbeitungs-Pipeline vorgestellt, der einige Einschränkungen früherer Ansätze überwindet, indem er eine lernbasierte Ähnlichkeitsbewertung zwischen Erkennungen über mehrere Frames hinweg einführt. Unser Ansatz verbessert die Ergebnisse von State-of-the-Art-Spezialvideo-Detektoren, insbesondere bei schnell bewegten Objekten, und zeichnet sich durch geringen Ressourcenverbrauch aus. Zudem ist er mit effizienten Bild-Detektoren wie YOLO kompatibel und liefert Ergebnisse, die denen viel rechenintensiverer Detektoren vergleichbar sind.