HyperAIHyperAI

Command Palette

Search for a command to run...

Lokalisierte semantische Feature-Mixer für eine effiziente Fußgängerdetektion im autonomen Fahren

Andreas Dengel Mohammed Shariq Nawaz Abdul Hannan Khan

Zusammenfassung

Autonome Fahrsysteme setzen stark auf das zugrundeliegende Wahrnehmungsmodul, das sowohl leistungsstark als auch effizient sein muss, um präzise Entscheidungen in Echtzeit zu ermöglichen. Die Vermeidung von Kollisionen mit Fußgängern steht dabei an erster Stelle jeder autonomen Fahrfunktion. Daher ist die Erkennung von Fußgängern eine zentrale Komponente der Wahrnehmungsmodularchitektur solcher Systeme. Aktuelle State-of-the-Art-Fußgängerdetektoren weisen zwei wesentliche Probleme auf: Erstens sind ihre Inferenzzeiten lang, was die Effizienz des gesamten Wahrnehmungsmoduls beeinträchtigt, und zweitens erzielen sie eine schlechte Leistung bei kleinen und stark verdeckten Fußgängern. Wir stellen Localized Semantic Feature Mixers (LSFM) vor, eine neuartige, anchor-free Architektur für die Fußgängererkennung. Statt der rechenintensiven Feature Pyramid Networks (FPNs) verwendet sie unsere neuartige Super Pixel Pyramid Pooling-Modul zur Merkmalsextraktion. Zudem dient unser MLPMixer-basiertes Dense Focal Detection Network als leichtgewichtiges Detektionskopf-Modul, wodurch der Rechenaufwand und die Inferenzzeit im Vergleich zu bestehenden Ansätzen reduziert werden. Um die Leistung der vorgeschlagenen Architektur weiter zu steigern, adaptieren und nutzen wir die Mixup-Augmentierung, die insbesondere bei kleinen und stark verdeckten Fußgängern die Erkennungsleistung verbessert. Wir evaluieren LSFM anhand etablierter Datensätze aus Verkehrsszenen im Vergleich zu State-of-the-Art-Methoden. Das vorgeschlagene LSFM erreicht in den Datensätzen Caltech, City Persons, Euro City Persons und TJU-Traffic-Pedestrian den Stand der Technik, wobei sich die Inferenzzeit im Durchschnitt um 55 % reduziert. Zudem übertrifft LSFM erstmals in der Geschichte der Fußgängererkennung die menschliche Baseline. Schließlich führen wir eine Cross-Dataset-Evaluation durch, die belegt, dass LSFM gut auf unbekannte Daten generalisiert.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp