HyperAIHyperAI
vor 13 Tagen

SVGA-Net: Sparse Voxel-Graph Attention Network für die 3D-Objekterkennung aus Punktwolken

Qingdong He, Zhengning Wang, Hao Zeng, Yi Zeng, Yijun Liu
SVGA-Net: Sparse Voxel-Graph Attention Network für die 3D-Objekterkennung aus Punktwolken
Abstract

Genauige 3D-Objekterkennung aus Punktwolken ist zu einer entscheidenden Komponente im Bereich des autonomen Fahrens geworden. Allerdings können die volumetrischen Darstellungen und Projektionsmethoden in früheren Arbeiten keine Beziehungen zwischen lokalen Punktmengen herstellen. In diesem Paper stellen wir den Sparse Voxel-Graph Attention Network (SVGA-Net) vor, ein neuartiges end-to-end trainierbares Netzwerk, das hauptsächlich aus einem Voxel-Graph-Modul und einem Sparse-to-Dense-Regression-Modul besteht und vergleichbare 3D-Erkennungsaufgaben aus rohen LIDAR-Daten ermöglicht. Konkret konstruiert SVGA-Net innerhalb jedes in 3D-sphärische Voxel unterteilten Bereichs einen lokalen vollständigen Graphen sowie einen globalen KNN-Graphen über alle Voxel. Die lokalen und globalen Graphen fungieren als Aufmerksamkeitsmechanismus zur Verbesserung der extrahierten Merkmale. Darüber hinaus erhöht das neuartige Sparse-to-Dense-Regression-Modul die Genauigkeit der 3D-Box-Schätzung durch Merkmalskartenaggregation auf verschiedenen Ebenen. Experimente am KITTI-Erkennungsbenchmark belegen die Effizienz der Erweiterung der Graphendarstellung auf die 3D-Objekterkennung, und der vorgeschlagene SVGA-Net erreicht eine ansprechende Erkennungsgenauigkeit.