HyperAIHyperAI
vor 11 Tagen

PillarNet: Echtzeit- und leistungsstarker, auf Säulen basierender 3D-Objektdetektion

Guangsheng Shi, Ruifeng Li, Chao Ma
PillarNet: Echtzeit- und leistungsstarker, auf Säulen basierender 3D-Objektdetektion
Abstract

Echtzeit- und leistungsstarke 3D-Objekterkennung ist für autonome Fahrzeuge von entscheidender Bedeutung. Aktuelle führende 3D-Objekterkennungsmethoden basieren hauptsächlich auf punktbasierter oder 3D-Voxel-basierter Faltung, die beide rechnerisch ineffizient für die Onboard-Implementierung sind. Im Gegensatz dazu verwenden pillarbasierte Methoden ausschließlich 2D-Faltungen, was weniger Rechenressourcen verbraucht, jedoch in der Erkennungsgenauigkeit weit hinter ihren Voxel-basierten Pendants zurückbleibt. In diesem Paper untersuchen wir die zentrale Leistungsunterschiede zwischen pillar- und voxelbasierten Detektoren und entwickeln darauf basierend einen Echtzeit- und leistungsstarken pillarbasierten Detektor namens PillarNet. Der vorgeschlagene PillarNet besteht aus einem leistungsfähigen Encoder-Netzwerk zur effektiven Lernung von Pillar-Features, einem Neck-Netzwerk zur räumlich-semantischen Merkmalsfusion sowie einem üblicherweise verwendeten Detektionskopf. Da PillarNet ausschließlich 2D-Faltungen nutzt, ist es flexibel hinsichtlich der gewählten Pillar-Größe und kompatibel mit klassischen 2D-CNN-Backbones wie VGGNet und ResNet. Zudem profitiert PillarNet von unserem entworfenen orientierungsdiskreten IoU-Regressionsverlust sowie von einem IoU-orientierten Vorhersagezweig. Ausführliche experimentelle Ergebnisse auf den großskaligen Datensätzen nuScenes und Waymo Open Dataset zeigen, dass PillarNet im Hinblick auf Effektivität und Effizienz gegenüber aktuellen State-of-the-Art-3D-Detektoren überzeugt. Der Quellcode ist unter \url{https://github.com/agent-sgs/PillarNet} verfügbar.

PillarNet: Echtzeit- und leistungsstarker, auf Säulen basierender 3D-Objektdetektion | Neueste Forschungsarbeiten | HyperAI