HyperAIHyperAI
vor 16 Tagen

Objekt als Hotspots: Ein anchorfreier Ansatz zur 3D-Objekterkennung über das Auslösen von Hotspots

Qi Chen, Lin Sun, Zhixin Wang, Kui Jia, Alan Yuille
Objekt als Hotspots: Ein anchorfreier Ansatz zur 3D-Objekterkennung über das Auslösen von Hotspots
Abstract

Die präzise 3D-Objektdetektion in LiDAR-basierten Punktwolken leidet unter den Herausforderungen der Daten-Spärlichkeit und Irregularität. Bestehende Methoden bemühen sich, die Punkte regelmäßig zu organisieren, beispielsweise durch Voxelisierung, anschließend durch speziell entworfene 2D-/3D-Neuronale Netze zu leiten und schließlich objektbezogene Anchor-Regionen zu definieren, die mithilfe von kollektiven Hinweisen aller Punkte auf einem interessierenden Objekt die Verschiebungen von 3D-Bounding-Boxes vorhersagen. Im Gegensatz zu den aktuell fortschrittlichsten anchor-basierten Ansätzen stellen wir aufgrund der grundlegenden Natur der Daten-Spärlichkeit fest, dass selbst Punkte auf einzelnen Objektteilen informative Hinweise auf die semantische Information des gesamten Objekts liefern können. Daher argumentieren wir in diesem Artikel für einen Ansatz, der dem herkömmlichen Vorgehen mit objektbezogenen Anchors entgegengesetzt ist. Inspiriert von kompositionellen Modellen, die ein Objekt als Zusammensetzung aus Teilen und deren räumlichen Beziehungen darstellen, schlagen wir vor, ein Objekt als Zusammensetzung seiner inneren, nicht-leeren Voxel – sogenannter „Hotspots“ – sowie der räumlichen Beziehungen zwischen diesen Hotspots zu repräsentieren. Dies führt zur Einführung der Objekt-als-Hotspots-(OHS)-Darstellung. Auf Basis von OHS entwickeln wir zudem einen anchor-freien Detektionskopf mit einer neuartigen Ground-Truth-Zuweisungsstrategie, die das Problem der inter-objektiven Punkt-Spärlichkeitsungleichgewicht adressiert und verhindert, dass das Netzwerk tendenziell Objekte mit mehr Punkten bevorzugt. Experimentelle Ergebnisse zeigen, dass unsere vorgeschlagene Methode insbesondere bei Objekten mit wenigen Punkten hervorragend funktioniert. Besonders hervorzuheben ist, dass unser Ansatz den ersten Platz beim KITTI 3D-Detektionsbenchmark für die Erkennung von Radfahrern und Fußgängern erreichte und eine state-of-the-art-Leistung auf dem NuScenes 3D-Detektionsbenchmark erzielte.

Objekt als Hotspots: Ein anchorfreier Ansatz zur 3D-Objekterkennung über das Auslösen von Hotspots | Neueste Forschungsarbeiten | HyperAI