MeshWalker: Tiefes Verständnis von Netzen durch Zufallswege

Die meisten Versuche, 3D-Formen für das Deep Learning darzustellen, haben sich auf volumetrische Gitter, multiview-Bilder und Punktwolken konzentriert. In dieser Arbeit betrachten wir die am häufigsten verwendete Darstellung von 3D-Formen in der Computergrafik – ein dreieckiges Netz (triangular mesh) – und fragen, wie es im Kontext des Deep Learnings genutzt werden kann. Die wenigen bisherigen Ansätze zur Beantwortung dieser Frage schlagen vor, Faltungen und Pooling anzupassen, um sie für Faltungsschichtneuronale Netze (CNNs) geeignet zu machen. Diese Arbeit propose einen sehr anderen Ansatz, den sogenannten MeshWalker, um die Form direkt aus einem gegebenen Netz zu lernen. Das Kernkonzept besteht darin, das Netz durch zufällige Pfade entlang der Oberfläche zu repräsentieren, die dessen Geometrie und Topologie "erforschen". Jeder Pfad wird als Liste von Knoten organisiert, was in gewisser Weise Regularität auf das Netz auflegt. Der Pfad wird in ein rekurrentes neuronales Netz (RNN) eingespeist, das die Geschichte des Pfades "speichert". Wir zeigen, dass unser Ansatz für zwei grundlegende Aufgaben der Formanalyse – Formklassifizierung und semantische Segmentierung – Stand der Technik ist. Darüber hinaus reichen auch sehr wenige Beispiele aus, um das Lernen erfolgreich durchzuführen. Dies ist von hoher Bedeutung, da große Datensätze von Netzen schwer zu erlangen sind.