HyperAIHyperAI
vor 15 Tagen

F2DNet: Fast Focal Detection Network für die Fußgängererkennung

Abdul Hannan Khan, Mohsin Munir, Ludger van Elst, Andreas Dengel
F2DNet: Fast Focal Detection Network für die Fußgängererkennung
Abstract

Zwei-Stufen-Detektoren gehören derzeit zu den fortschrittlichsten Ansätzen im Objektdetektions- und insbesondere im Fußgängerdetektionsbereich. Dennoch sind die aktuellen zwei-Stufen-Detektoren ineffizient, da sie die Bounding-Box-Regression in mehreren Schritten durchführen – nämlich in Region Proposal Networks (RPNs) und Bounding-Box-Köpfen. Zudem sind anchor-basierte Region Proposal Networks rechenintensiv im Training. Wir stellen F2DNet vor, eine neuartige zwei-Stufen-Detektionsarchitektur, die die Redundanz bestehender zwei-Stufen-Detektoren durch den Ersatz der Region Proposal Network mit unserer focal detection network (Focal Detection Network) und des Bounding-Box-Kopfes durch unseren fast suppression head (Fast-Suppression-Kopf) beseitigt. Wir evaluieren F2DNet anhand der führenden Fußgängerdetektions-Datensätze, vergleichen sie gründlich mit den aktuellen state-of-the-art-Detektoren und führen eine cross-dataset-Evaluation durch, um die Generalisierbarkeit unseres Modells auf unbekannte Daten zu testen. F2DNet erreicht bei Training auf einer einzelnen Datensatz 8,7 %, 2,2 % und 6,1 % MR-2 auf den Datensätzen City Persons, Caltech Pedestrian und Euro City Persons, wobei bei Verwendung von progressive fine-tuning in der schweren Okklusions-Situation von Caltech Pedestrian und City Persons 20,4 % und 26,2 % MR-2 erzielt werden. Zudem weist F2DNet im Vergleich zu den aktuellen state-of-the-art-Methoden signifikant geringere Inference-Zeiten auf. Der Quellcode und die trainierten Modelle werden unter https://github.com/AbdulHannanKhan/F2DNet zur Verfügung gestellt.

F2DNet: Fast Focal Detection Network für die Fußgängererkennung | Neueste Forschungsarbeiten | HyperAI