HyperAIHyperAI
vor 17 Tagen

Patch Refinement – Lokalisierte 3D-Objekterkennung

Johannes Lehner, Andreas Mitterecker, Thomas Adler, Markus Hofmarcher, Bernhard Nessler, Sepp Hochreiter
Patch Refinement – Lokalisierte 3D-Objekterkennung
Abstract

Wir stellen Patch Refinement vor, ein zweistufiges Modell für eine genaue 3D-Objektdetektion und -lokalisierung aus Punktwolken-Daten. Patch Refinement besteht aus zwei unabhängig voneinander trainierten, auf VoxelNet basierenden Netzwerken: einem Region Proposal Network (RPN) und einem Local Refinement Network (LRN). Wir zerlegen die Detektionsaufgabe in einen vorläufigen Bird’s Eye View (BEV)-Detektions-Schritt und einen lokalen 3D-Detektions-Schritt. Auf Basis der vom RPN vorgeschlagenen BEV-Positionen extrahieren wir kleine Punktwolken-Teilmengen („Patches“), die anschließend vom LRN verarbeitet werden. Da jeder Patch einen geringen räumlichen Bereich abdeckt, ist das LRN weniger durch Speicherbeschränkungen eingeschränkt. Dadurch können wir lokal eine höhere Voxel-Auflösung verwenden. Die Unabhängigkeit des LRN ermöglicht den Einsatz zusätzlicher Augmentierungstechniken und erlaubt eine effiziente, regressionsorientierte Trainingsstrategie, da nur ein kleiner Bruchteil jeder Szene genutzt wird. Auf dem KITTI 3D-Objektdetektionsbenchmark erzielte unsere Einreichung vom 28. Januar 2019 die besten Ergebnisse aller vorherigen Einreichungen für alle drei Schwierigkeitsstufen der Klasse „Auto“, wobei lediglich 50 % der verfügbaren Trainingsdaten und ausschließlich LiDAR-Informationen verwendet wurden.

Patch Refinement – Lokalisierte 3D-Objekterkennung | Neueste Forschungsarbeiten | HyperAI