Dynamisches Graph-CNN für das Lernen auf Punktwolken

Punktewolken bieten eine flexible geometrische Darstellung, die für zahlreiche Anwendungen in der Computergrafik geeignet ist; sie bilden auch die rohe Ausgabe der meisten 3D-Datenerfassungsgeräte. Obwohl manuell entworfene Merkmale auf Punktewolken lange Zeit in Grafik und Vision vorgeschlagen wurden, deutet der jüngste überwältigende Erfolg von Faltungsneuronalen Netzen (CNNs) bei der Bildanalyse darauf hin, dass Erkenntnisse aus CNNs für die Welt der Punktewolken angepasst werden können. Punktewolken fehlen intrinsisch topologische Informationen, sodass das Design eines Modells zur Wiederherstellung dieser Topologie die Darstellungskraft von Punktewolken erweitern kann. Zu diesem Zweck schlagen wir ein neues neuronales Netzwerkmodul vor, das als EdgeConv bezeichnet wird und für CNN-basierte hochstufige Aufgaben auf Punktewolken wie Klassifizierung und Segmentierung geeignet ist. EdgeConv arbeitet auf Graphen, die in jeder Schicht des Netzwerks dynamisch berechnet werden. Es ist differenzierbar und kann in bestehende Architekturen integriert werden. Im Vergleich zu existierenden Modulen, die im extrinsischen Raum operieren oder jeden Punkt unabhängig behandeln, hat EdgeConv mehrere ansprechende Eigenschaften: Es berücksichtigt lokale Nachbarschaftsinformationen; es kann gestapelt angewendet werden, um globale Formmerkmale zu lernen; und in mehrschichtigen Systemen fängt die Ähnlichkeit im Merkmalsraum semantische Charakteristika über potentiell große Distanzen im ursprünglichen Einbettungsraum ein. Wir zeigen die Leistungsfähigkeit unseres Modells an Standard-Benchmarks wie ModelNet40, ShapeNetPart und S3DIS.