2 个月前
基于体积和多视图的CNNs用于3D数据的对象分类
Charles R. Qi; Hao Su; Matthias Niessner; Angela Dai; Mengyuan Yan; Leonidas J. Guibas

摘要
三维形状模型正变得越来越普及且易于获取,使得三维信息对于物体分类的进步至关重要。目前最先进的方法依赖于卷积神经网络(CNN)来解决这一问题。近期,我们见证了两种类型的CNN的发展:基于体素表示的CNN与基于多视图表示的CNN。这两种类型CNN的经验结果存在较大差距,表明现有的体素CNN架构和方法未能充分利用三维表示的优势。在本文中,我们旨在通过对现有方法进行广泛分析,改进体素CNN和多视图CNN。为此,我们引入了两种不同的体素CNN网络架构。此外,我们在多视图CNN中引入了三维多分辨率滤波。总体而言,我们能够在体素CNN和多视图CNN方面超越当前最先进的方法。我们设计了大量实验以评估基础设计选择,从而为用于三维数据物体分类的方法空间提供更好的理解。