Deformable PV-RCNN: Verbesserung der 3D-Objekterkennung durch gelernte Deformationen

Wir präsentieren Deformable PV-RCNN, einen leistungsstarken auf Punktwolken basierenden 3D-Objektdetektor. Derzeit können die von den aktuell besten zweistufigen Detektoren eingesetzten Vorschlagsverfeinerungsmethoden die unterschiedlichen Objektgrößen, variierende Dichten der Punktwolken, Teilverformungen und Komplexität (Clutter) nicht ausreichend berücksichtigen. Wir stellen ein Vorschlagsverfeinerungsmodul vor, das sich an 2D-deformierbaren Faltungsnetzwerken orientiert und adaptiv Merkmale aus Orten mit informativem Inhalt für jedes einzelne Objekt sammelt. Zudem schlagen wir eine einfache Kontext-Gating-Mechanismus vor, der es den Schlüsselpunkten ermöglicht, relevante Kontextinformationen für die Verfeinerungsstufe auszuwählen. Wir erzielen state-of-the-art-Ergebnisse auf dem KITTI-Datensatz.