HyperAIHyperAI
vor 2 Monaten

PointPillars: Schnelle Encoder für die Objekterkennung aus Punktwolken

Lang, Alex H. ; Vora, Sourabh ; Caesar, Holger ; Zhou, Lubing ; Yang, Jiong ; Beijbom, Oscar
PointPillars: Schnelle Encoder für die Objekterkennung aus Punktwolken
Abstract

Die Objekterkennung in Punktwolken ist ein wichtiger Aspekt vieler Robotik-Anwendungen, wie zum Beispiel autonomer Fahrzeuge. In dieser Arbeit betrachten wir das Problem der Kodierung einer Punktwolke in ein Format, das für eine nachgelagerte Erkennungs Pipeline geeignet ist. Die jüngste Literatur schlägt zwei Arten von Kodierern vor: feste Kodierer sind tendenziell schnell, opfern aber Genauigkeit, während datengestützte gelernte Kodierer genauer sind, aber langsamer arbeiten. In dieser Arbeit schlagen wir PointPillars vor, einen neuen Kodierer, der PointNets nutzt, um eine Darstellung von in vertikalen Säulen (Pillaren) organisierten Punktwolken zu lernen. Obwohl die kodierten Merkmale mit jeder standardmäßigen 2D-Faltungs-Erkennungsarchitektur verwendet werden können, schlagen wir ein schlankes nachgelagertes Netzwerk weiter vor. Ausführliche Experimente zeigen, dass PointPillars sowohl hinsichtlich Geschwindigkeit als auch Genauigkeit deutlich bessere Ergebnisse als frühere Kodierer erzielt. Trotz der ausschließlichen Verwendung von Lidar übertreffen unsere vollständige Erkennungs-Pipeline die Standesmethoden erheblich, sogar im Vergleich zu Fusionsmethoden, sowohl bei den 3D- als auch bei den Vogelperspektiv-KITTI-Benchmarks. Diese Erkennungsleistung wird bei einer Ausführungsrate von 62 Hz erreicht: eine Verbesserung des Laufzeitsverhaltens um das 2- bis 4-fache. Eine schnellere Version unserer Methode erreicht den Stand der Technik bei 105 Hz. Diese Benchmarks legen nahe, dass PointPillars eine angemessene Kodierung für die Objekterkennung in Punktwolken darstellt.

PointPillars: Schnelle Encoder für die Objekterkennung aus Punktwolken | Neueste Forschungsarbeiten | HyperAI