HyperAIHyperAI
vor 13 Tagen

RBGNet: Ray-basierte Gruppierung für die 3D-Objekterkennung

Haiyang Wang, Shaoshuai Shi, Ze Yang, Rongyao Fang, Qi Qian, Hongsheng Li, Bernt Schiele, Liwei Wang
RBGNet: Ray-basierte Gruppierung für die 3D-Objekterkennung
Abstract

Als ein grundlegendes Problem im Bereich der Computer Vision erfährt die 3D-Objekterkennung derzeit ein schnelles Wachstum. Um punktweise Merkmale aus irregulär und spärlich verteilten Punkten zu extrahieren, verwenden herkömmliche Methoden üblicherweise ein Merkmalsgruppierungsmodul, um die PunktmERKMEN in eine Objektkandidatengruppe zu aggregieren. Diese Ansätze haben jedoch noch nicht die Oberflächengeometrie von Vordergrundobjekten genutzt, um die Gruppierung und die Generierung von 3D-Bounding-Boxen zu verbessern. In diesem Paper stellen wir den RBGNet-Framework vor, einen auf Votes basierenden 3D-Detektor zur präzisen Erkennung von 3D-Objekten aus Punktwolken. Um bessere Darstellungen der Objektform zu lernen und somit die Clustermerkmale zur Vorhersage von 3D-Boxen zu verbessern, schlagen wir ein strahlenbasiertes Merkmalsgruppierungsmodul vor, das die punktweisen Merkmale auf Objektoberflächen mithilfe einer Reihe gleichmäßig von den Clusterzentren ausgesandter Strahlen aggregiert. Angesichts der Tatsache, dass Vordergrundpunkte für die Boxabschätzung aussagekräftiger sind, entwickeln wir eine neuartige, auf Vordergrund fokussierte Abtaststrategie im Downsampling-Prozess, um mehr Punkte auf Objektoberflächen zu wählen und die Detektionsleistung weiter zu steigern. Unser Modell erreicht state-of-the-art Ergebnisse bei der 3D-Objekterkennung auf den Datensätzen ScanNet V2 und SUN RGB-D mit signifikanten Leistungssteigerungen. Der Quellcode wird unter https://github.com/Haiyang-W/RBGNet verfügbar sein.

RBGNet: Ray-basierte Gruppierung für die 3D-Objekterkennung | Neueste Forschungsarbeiten | HyperAI