Rückverfolgung repräsentativer Punkte für abstimmungsbasierte 3D-Objektdetektion in Punktwolken

Die 3D-Objekterkennung in Punktwolken ist eine anspruchsvolle Aufgabe im Bereich der Computer Vision, die zahlreiche Anwendungen zur Verständnis der 3D-visuellen Welt unterstützt. In jüngster Zeit konzentriert sich viel Forschung darauf, wie man end-to-end trainierbare Hough-Voting-Verfahren zur Generierung von Objektvorschlägen effizient nutzen kann. Allerdings kann die derzeitige Voting-Strategie nur partielle Votes von den Oberflächen potenzieller Objekte sowie starke Ausreißer-Votes aus störenden Hintergründen empfangen, was die vollständige Ausnutzung der Informationen aus den Eingabepunktwolken behindert. Inspiriert durch die Rückverfolgungsstrategie klassischer Hough-Voting-Methoden stellen wir in diesem Werk einen neuen Ansatz zur 3D-Objekterkennung vor, den wir Back-tracing Representative Points Network (BRNet) nennen. BRNet generiert rückwärts die repräsentativen Punkte aus den Voting-Zentren und besucht zudem ergänzende Keypunkte in der Nähe dieser generierten Punkte, um so feinere lokale Strukturmerkmale um potenzielle Objekte aus den Rohpunktwolken besser zu erfassen. Dadurch stärkt die bottom-up dann top-down Strategie in unserem BRNet die gegenseitige Konsistenz zwischen den vorhergesagten Voting-Zentren und den ursprünglichen Oberflächenpunkten und erreicht so zuverlässigere und flexiblere Ergebnisse bei der Objektlokalisierung und Klassifizierung. Unser BRNet ist einfach, aber äußerst effektiv und übertrifft die derzeit besten Methoden signifikant auf zwei großen Punktwolken-Datensätzen: ScanNet V2 (+7,5 % in Bezug auf mAP@0,50) und SUN RGB-D (+4,7 % in Bezug auf mAP@0,50), wobei es dennoch leichtgewichtig und effizient bleibt. Der Quellcode wird unter https://github.com/cheng052/BRNet verfügbar sein.