2 个月前
PointNeXt:重新审视PointNet++并改进训练和扩展策略
Qian, Guocheng ; Li, Yuchen ; Peng, Houwen ; Mai, Jinjie ; Hammoud, Hasan Abed Al Kader ; Elhoseiny, Mohamed ; Ghanem, Bernard

摘要
PointNet++ 是点云理解领域最具影响力的神经架构之一。尽管 PointNet++ 的准确性已被近期的网络如 PointMLP 和 Point Transformer 大幅超越,但我们发现,性能提升的很大一部分归因于改进的训练策略(即数据增强和优化技术)以及模型规模的扩大,而非架构创新。因此,PointNet++ 的全部潜力尚未得到充分挖掘。在本研究中,我们通过系统地研究模型训练和扩展策略,重新审视了经典的 PointNet++,并做出了两项主要贡献。首先,我们提出了一套改进的训练策略,显著提升了 PointNet++ 的性能。例如,在不改变架构的情况下,PointNet++ 在 ScanObjectNN 物体分类任务上的整体准确率(OA)可以从 77.9% 提高到 86.1%,甚至超过了最先进的 PointMLP。其次,我们将倒残差瓶颈设计和可分离多层感知机(MLPs)引入 PointNet++,以实现高效且有效的模型扩展,并提出了 PointNeXt——PointNets 的下一代版本。PointNeXt 可灵活扩展,并在 3D 分类和分割任务上均优于现有最先进方法。在分类任务中,PointNeXt 在 ScanObjectNN 上达到了 87.7% 的整体准确率,比 PointMLP 高出 2.3%,同时推理速度提高了 10 倍。在语义分割任务中,PointNeXt 在 S3DIS 数据集(6 折交叉验证)上实现了新的最先进性能,平均交并比(mean IoU)达到 74.9%,优于最近的 Point Transformer。代码和模型可在 https://github.com/guochengqian/pointnext 获取。