HyperAIHyperAI
vor 2 Monaten

Fahrzeugerkennung aus 3D-Lidar-Daten mit vollkonvolutiven Netzen

Bo Li; Tianlei Zhang; Tian Xia
Fahrzeugerkennung aus 3D-Lidar-Daten mit vollkonvolutiven Netzen
Abstract

Techniken von Faltungsnetzen (Convolutional Network Techniques) haben kürzlich bei visuellen Detektionsaufgaben großen Erfolg erzielt. In dieser Arbeit wird die jüngste Entwicklung unseres Forschungsprojekts vorgestellt, bei dem die Technik der vollständig faltenden Netze (Fully Convolutional Network Technique) auf Detektionsaufgaben mit 3D-Laserabtastdaten übertragen wurde. Insbesondere handelt es sich um die Aufgabe des Fahrzeugdetektions aus den Abtastdaten des Velodyne 64E Lidars. Wir schlagen vor, die Daten in einer 2D-Punktlandkarte darzustellen und ein einzelnes 2D-End-to-End-Faltungsnetz zu verwenden, um gleichzeitig das Objektwahrscheinlichkeitsmaß (objectness confidence) und die Begrenzungsrahmen (bounding boxes) vorherzusagen. Durch sorgfältige Gestaltung der Kodierung der Begrenzungsrahmen ist es möglich, sogar mit einem 2D-Faltungsnetz vollständige 3D-Begrenzungsrahmen vorherzusagen. Experimente mit dem KITTI-Datensatz zeigen die Stand-der-Technik-Leistung der vorgeschlagenen Methode.请注意,我已将“point map”翻译为“Punktlandkarte”,这是根据上下文对点云数据在二维平面上表示的一种解释。如果您的目标读者更熟悉其他术语,如“Punktkarte”或“Punktplan”,您可以选择相应的替代词。此外,“state-of-the-art”被翻译为“Stand-der-Technik”,这是德语中常用的对应表达。