HyperAIHyperAI
vor 11 Tagen

SMURF: Spatial Multi-Representation Fusion für die 3D-Objekterkennung mit 4D-Bildgebungsradar

Jianan Liu, Qiuchi Zhao, Weiyi Xiong, Tao Huang, Qing-Long Han, Bing Zhu
SMURF: Spatial Multi-Representation Fusion für die 3D-Objekterkennung mit 4D-Bildgebungsradar
Abstract

Der 4D-Millimeterwellen-(mmWave)-Radar stellt aufgrund seiner kosteneffizienten Implementierung und Zuverlässigkeit unter ungünstigen Wetterbedingungen eine vielversprechende Technologie für die Fahrzeugumfeldwahrnehmung dar. Allerdings wurde die breitere Einführung dieser Technologie bislang durch Probleme der Sparsamkeit und Rauschempfindlichkeit in den Radar-Punktwolken behindert. In diesem Artikel wird ein neuartiger Ansatz namens Spatial Multi-Representation Fusion (SMURF) vorgestellt, der auf der 3D-Objekterkennung mit einem einzigen 4D-Bildgebungsradar basiert. SMURF nutzt mehrere Darstellungsformen der Radar-Erkennungspunkte, darunter die Pfeiler- und Dichtefeatures einer mehrdimensionalen Gaußschen Mischverteilung, die mittels Kerndichteschätzung (Kernel Density Estimation, KDE) ermittelt werden. Die KDE reduziert wirksam Messunsicherheiten, die durch die begrenzte Winkelauflösung und Mehrwegeausbreitung der Radarwellen verursacht werden, und trägt gleichzeitig zur Verringerung der Punktdichte-Sparsamkeit bei, indem sie Dichtemuster erfassen kann. Experimentelle Bewertungen an den Datensätzen View-of-Delft (VoD) und TJ4DRadSet belegen die Wirksamkeit und Generalisierungsfähigkeit von SMURF, wobei das Verfahren kürzlich vorgeschlagene Einzel-Darstellungsmodelle auf Basis von 4D-Bildgebungsradaren deutlich übertrifft. Zudem erreicht SMURF, obwohl ausschließlich 4D-Bildgebungsradar verwendet wird, eine vergleichbare Leistungsfähigkeit mit den aktuellen state-of-the-art-Methoden, die 4D-Radar und Kamera fusionieren. Auf dem TJ4DRadSet-Datensatz steigt die mittlere Genauigkeit im Vogelperspektiv-Blick (bird’s-eye view) um 1,22 %, und auf dem VoD-Datensatz erhöht sich die 3D-mittlere Genauigkeit im gesamten annotierten Bereich um 1,32 %. Unser vorgeschlagener Ansatz zeigt zudem beeindruckende Inferenzzeiten und löst die Herausforderungen der Echtzeit-Erkennung: Die Inferenzzeit liegt für die meisten Scans beider Datensätze unter 0,05 Sekunden. Diese Forschung unterstreicht die Vorteile von 4D-mmWave-Radaren und stellt eine starke Benchmark für zukünftige Arbeiten zur 3D-Objekterkennung mit 4D-Bildgebungsradaren dar.

SMURF: Spatial Multi-Representation Fusion für die 3D-Objekterkennung mit 4D-Bildgebungsradar | Neueste Forschungsarbeiten | HyperAI