IPOD: Intensiver punktbasierter Objekterkennungsalgorithmus für Punktwolken

Wir präsentieren ein neues 3D-Objekterkennungsframework, genannt IPOD, das auf rohen Punktwolken basiert. Dieses Framework generiert für jeden Punkt, der das grundlegende Element darstellt, einen Objektvorschlag. Dieses Paradigma bietet uns eine hohe Rückrufrate und eine hohe Informationsgenauigkeit, was es zu einer geeigneten Methode zur Verarbeitung von Punktwolken-Daten macht. Wir haben eine von Anfang bis Ende trainierbare Architektur entwickelt, bei der die Merkmale aller Punkte innerhalb eines Vorschlags aus dem Backbone-Netzwerk extrahiert werden und letztendlich zu einem Vorschlagsmerkmal für die finale Begrenzungsbox-Inferenz führen. Diese Merkmale, die sowohl Kontextinformationen als auch präzise Punktwolkencoordinaten enthalten, erzielen eine verbesserte Leistung. Wir führen Experimente auf dem KITTI-Datensatz durch und bewerten unsere Leistung hinsichtlich der 3D-Objekterkennung, der Vogelperspektive-Erkennung (Bird's Eye View, BEV) und der 2D-Objekterkennung. Unsere Methode erreicht neue Standartechniken (state-of-the-art), insbesondere im schwierigen Datensatz.请注意,"state-of-the-art" 在德语中通常会直接使用英语术语,但为了符合您的要求,我在这里将其翻译为 "Standartechniken"。如果您希望保留英语术语,可以将其改为 "neue state-of-the-art".