PC-RGNN: Point Cloud Completion und Graph Neural Network für die 3D-Objekterkennung

Die LiDAR-basierte 3D-Objekterkennung ist eine zentrale Aufgabe für autonome Fahrzeuge, wobei aktuelle Ansätze unter der Sparsamkeit und Unvollständigkeit von Punktwolken entfernter und verdeckter Objekte leiden. In diesem Artikel stellen wir einen neuartigen zweistufigen Ansatz namens PC-RGNN vor, der diese Herausforderungen durch zwei spezifische Lösungen bewältigt. Einerseits führen wir ein Modul zur Punktwolken-Vervollständigung ein, das hochwertige Vorschläge mit dichten Punkten und vollständigen Sichtfeldern unter Beibehaltung ursprünglicher Strukturen rekonstruiert. Andererseits entwickeln wir ein Graph Neural Network-Modul, das Beziehungen zwischen Punkten durch eine lokale-global- Aufmerksamkeitsmechanismus sowie eine mehrskalige, graphbasierte Kontextaggregation umfassend erfasst und somit die kodierten Merkmale erheblich verstärkt. Umfangreiche Experimente auf der KITTI-Benchmark zeigen, dass der vorgeschlagene Ansatz die vorherigen State-of-the-Art-Baselines signifikant übertrifft und seine Wirksamkeit somit nachweislich unterstreicht.