
摘要
大多数针对深度学习的三维形状表示方法都集中在体素网格、多视图图像和点云上。本文探讨了计算机图形学中最流行的三维形状表示方法——三角网格,并研究了如何在深度学习中利用这一表示方法。对于这一问题,少数尝试提出对卷积和池化进行适应性调整以适用于卷积神经网络(CNNs)。而本文则提出了一种截然不同的方法,称为MeshWalker,直接从给定的网格中学习形状。其核心思想是通过沿表面的随机游走来表示网格,这些游走“探索”了网格的几何和拓扑结构。每次游走被组织为顶点列表,这在某种程度上赋予了网格规律性。游走序列被输入到一个循环神经网络(RNN)中,该网络“记住”了游走的历史。我们展示了我们的方法在两个基本的形状分析任务——形状分类和语义分割中达到了最先进的结果。此外,即使只有少量样本也足以进行学习,这一点尤为重要,因为获取大规模的网格数据集非常困难。