
摘要
构建具有判别性的三维数据表示一直是计算机图形学和计算机视觉研究中的重要任务。卷积神经网络(CNNs)在处理二维图像的各种任务中已经取得了巨大成功。将卷积算子扩展到三维空间(3DCNNs)似乎是一个合理且有前景的下一步。然而,不幸的是,3D CNNs 的计算复杂度随着体素分辨率的增加而呈立方增长。此外,由于大多数三维几何表示都是基于边界,占据区域并不会随着离散化尺寸的增大而成比例增加,导致计算资源的浪费。在这项工作中,我们将三维空间表示为体积场,并提出了一种新颖的设计,该设计利用场探测滤波器高效地从这些体积场中提取特征。每个场探测滤波器是一组探测点——感知空间的传感器。我们的学习算法不仅优化了与探测点相关的权重,还优化了它们的位置,从而改变了探测滤波器的形状并自适应地将其分布在三维空间中。优化后的探测点能够“智能”地感知三维空间,而不是盲目地在整个域上操作。我们展示了场探测方法在显著提高效率的同时,在用于3D物体识别基准数据集的分类任务中提供了最先进的性能。