
摘要
当前室内场景下的3D目标检测方法主要采用“投票-分组”策略生成候选区域。然而,大多数方法使用与实例无关的分组方式(如球查询),导致候选区域内部语义信息不一致,且回归结果不够准确。为此,本文提出一种面向室内无锚框单阶段3D目标检测的新型超点分组网络(Superpoint Grouping Network)。具体而言,我们首先以无监督方式将原始点云划分为超点(superpoints),即具有语义一致性与空间相似性的区域;随后设计了一个几何感知投票模块,通过约束超点与目标中心之间的空间关系,自适应地匹配无锚框检测中的中心度(centerness);接着,提出一种基于超点的分组模块,用于挖掘候选区域内部的一致性表征,该模块包含一个超点注意力层,用于学习邻近超点间的特征交互,以及一个超点-体素融合层,实现超点级信息向体素级的传播;最后,在训练阶段引入高效的多匹配策略,充分利用基于超点的候选区域所具备的动态感受野优势。实验结果表明,所提方法在ScanNet V2、SUN RGB-D和S3DIS等多个室内单阶段3D目标检测数据集上均达到了当前最优性能。项目源代码已开源,地址为:https://github.com/zyrant/SPGroup3D。