HyperAIHyperAI
vor 11 Tagen

Lokalisierte semantische Feature-Mixer für eine effiziente Fußgängerdetektion im autonomen Fahren

{Andreas Dengel, Mohammed Shariq Nawaz, Abdul Hannan Khan}
Lokalisierte semantische Feature-Mixer für eine effiziente Fußgängerdetektion im autonomen Fahren
Abstract

Autonome Fahrsysteme setzen stark auf das zugrundeliegende Wahrnehmungsmodul, das sowohl leistungsstark als auch effizient sein muss, um präzise Entscheidungen in Echtzeit zu ermöglichen. Die Vermeidung von Kollisionen mit Fußgängern steht dabei an erster Stelle jeder autonomen Fahrfunktion. Daher ist die Erkennung von Fußgängern eine zentrale Komponente der Wahrnehmungsmodularchitektur solcher Systeme. Aktuelle State-of-the-Art-Fußgängerdetektoren weisen zwei wesentliche Probleme auf: Erstens sind ihre Inferenzzeiten lang, was die Effizienz des gesamten Wahrnehmungsmoduls beeinträchtigt, und zweitens erzielen sie eine schlechte Leistung bei kleinen und stark verdeckten Fußgängern. Wir stellen Localized Semantic Feature Mixers (LSFM) vor, eine neuartige, anchor-free Architektur für die Fußgängererkennung. Statt der rechenintensiven Feature Pyramid Networks (FPNs) verwendet sie unsere neuartige Super Pixel Pyramid Pooling-Modul zur Merkmalsextraktion. Zudem dient unser MLPMixer-basiertes Dense Focal Detection Network als leichtgewichtiges Detektionskopf-Modul, wodurch der Rechenaufwand und die Inferenzzeit im Vergleich zu bestehenden Ansätzen reduziert werden. Um die Leistung der vorgeschlagenen Architektur weiter zu steigern, adaptieren und nutzen wir die Mixup-Augmentierung, die insbesondere bei kleinen und stark verdeckten Fußgängern die Erkennungsleistung verbessert. Wir evaluieren LSFM anhand etablierter Datensätze aus Verkehrsszenen im Vergleich zu State-of-the-Art-Methoden. Das vorgeschlagene LSFM erreicht in den Datensätzen Caltech, City Persons, Euro City Persons und TJU-Traffic-Pedestrian den Stand der Technik, wobei sich die Inferenzzeit im Durchschnitt um 55 % reduziert. Zudem übertrifft LSFM erstmals in der Geschichte der Fußgängererkennung die menschliche Baseline. Schließlich führen wir eine Cross-Dataset-Evaluation durch, die belegt, dass LSFM gut auf unbekannte Daten generalisiert.

Lokalisierte semantische Feature-Mixer für eine effiziente Fußgängerdetektion im autonomen Fahren | Neueste Forschungsarbeiten | HyperAI