18 天前

ViewNet:一种基于视角投影的新型主干网络与视角池化机制用于少样本点云分类

{Senem Velipasalar, Minmin Yang, Jiajing Chen}
ViewNet:一种基于视角投影的新型主干网络与视角池化机制用于少样本点云分类
摘要

尽管针对三维点云相关任务已提出多种方法,但三维点云的少样本学习(Few-Shot Learning, FSL)仍处于研究不足的状态。在少样本学习中,与传统监督学习不同,训练数据与测试数据的类别之间不存在重叠,模型需仅基于极少量样本识别未见类别。现有的三维点云少样本学习方法普遍采用基于点的模型作为主干网络。然而,通过大量实验与深入分析,我们首次发现,使用基于点的主干网络并非最优的少样本学习方案,原因在于:(i)三维点云主干网络中常用的最大池化操作会丢弃大量点的特征信息,从而削弱了对形状语义的表达能力;(ii)基于点的主干网络对遮挡现象较为敏感。为解决上述问题,我们提出采用一种基于投影与二维卷积神经网络的主干网络,称为ViewNet,用于从三维点云中进行少样本学习。该方法首先将三维点云投影到六个不同视角,以缓解因点缺失导致的信息损失问题。为进一步生成更具描述性与区分性的特征,我们提出一种新的特征聚合策略——View Pooling,该方法将不同投影平面的组合划分为五组,并对每组分别执行最大池化操作,从而增强特征的判别能力。在ModelNet40、ScanObjectNN以及ModelNet40-C数据集上进行的交叉验证实验表明,所提方法在各类少样本学习设置下均显著优于当前最先进的基线方法。此外,与传统的图像分类主干网络(如ResNet)相比,所提出的ViewNet能够从点云的多个视角中提取出更具区分性的特征。我们还验证了ViewNet可作为多种少样本学习头(FSL heads)的通用主干网络,并在性能上优于传统常用的主干结构。