Die perfekte Übereinstimmung: 3D-Punktwolkenabgleich mit geglätteten Dichten

Wir schlagen 3DSmoothNet vor, einen vollständigen Workflow zur Matching von 3D-Punktwolken mit einer siamesischen Tiefenlernarchitektur und vollständig konvolutiven Schichten unter Verwendung einer voxelisierten glätteten Dichte-Wert-Darstellung (Smoothed Density Value, SDV). Diese Darstellung wird für jeden Interpunkt berechnet und an das lokale Referenzrahmen (Local Reference Frame, LRF) ausgerichtet, um Rotationsinvarianz zu erreichen. Unser kompakter, gelernter, rotationsinvarianter 3D-Punktwolken-Deskriptor erreicht eine durchschnittliche Recall-Rate von 94,9 % auf dem Benchmark-Datensatz 3DMatch, wobei er den aktuellen Stand der Technik bei nur 32 Ausgabedimensionen um mehr als 20 Prozentpunkte übertrifft. Diese sehr niedrige Anzahl an Ausgabedimensionen ermöglicht eine nahezu Echtzeit-Korrespondenzsuche mit 0,1 ms pro Merkmalpunkt auf einem Standard-PC. Unser Ansatz ist sensoren- und szenenagnostisch dank SDV, LRF und des Lernens hochdeskriptiver Merkmale mit vollständig konvolutiven Schichten. Wir zeigen, dass 3DSmoothNet, das ausschließlich auf RGB-D-Innenaufnahmen von Gebäuden trainiert wurde, eine durchschnittliche Recall-Rate von 79,0 % auf Laserscans von Outdoor-Vegetation erreicht – mehr als doppelt so gut wie die Leistung unserer nächstgelegenen lernbasierten Konkurrenten. Der Quellcode, die Daten und die vortrainierten Modelle sind online unter https://github.com/zgojcic/3DSmoothNet verfügbar.