Ausnutzung der lokalen Geometrie zur Merkmals- und Graphenkonstruktion für eine verbesserte Verarbeitung von 3D-Punktwolken mit Graph Neural Networks

Wir schlagen einfache, jedoch wirksame Verbesserungen in der Darstellung von Punkten und der Konstruktion lokaler Nachbarschaftsgraphen innerhalb des allgemeinen Rahmens von Graph Neural Networks (GNNs) für die Verarbeitung von 3D-Punktwolken vor. Als ersten Beitrag schlagen wir vor, die Knotenrepräsentationen durch wichtige lokale geometrische Informationen der Punkte zu erweitern, gefolgt von einer nichtlinearen Projektion mittels eines MLP. Als zweiten Beitrag stellen wir eine Verbesserung der Graphenkonstruktion für GNNs bei 3D-Punktwolken vor. Die bestehenden Methoden basieren auf einem k-nn-Ansatz zur Erstellung des lokalen Nachbarschaftsgraphen. Wir argumentieren, dass dieser Ansatz bei dichter Abtastung durch Sensoren in bestimmten Bereichen der Szene zu einer Verringerung der Abdeckung führen kann. Der vorgeschlagene Ansatz zielt darauf ab, solche Probleme zu beheben und die Abdeckung in solchen Fällen zu verbessern. Da traditionelle GNNs für allgemeine Graphen konzipiert wurden, bei denen Knoten keine geometrische Interpretation haben müssen, betrachten wir beide Vorschläge als Erweiterung allgemeiner Graphen, um die geometrische Natur von 3D-Punktwolken zu berücksichtigen. Trotz der Einfachheit zeigen wir an mehreren anspruchsvollen Benchmarks – sowohl mit relativ sauberen CAD-Modellen als auch mit realen, rauschbehafteten Scans –, dass die vorgeschlagene Methode state-of-the-art-Ergebnisse für Benchmark-Aufgaben der 3D-Klassifikation (ModelNet40), der Teilesegmentierung (ShapeNet) und der semantischen Segmentierung (Stanford 3D Indoor Scenes Dataset) erzielt. Zudem zeigen wir, dass das vorgeschlagene Netzwerk eine schnellere Konvergenz beim Training erreicht, nämlich etwa 40 % weniger Epochen für die Klassifikation. Die detaillierten Projektinformationen sind unter https://siddharthsrivastava.github.io/publication/geomgcnn/ verfügbar.