
摘要
3D实例分割是场景理解中的基础任务,在机器人学与增强现实/虚拟现实(AR/VR)等领域具有广泛应用。近年来,众多无需候选框(proposal-free)的方法在该任务上取得了显著成果,并展现出高效性。然而,这些方法高度依赖实例中心点回归,且未显式检测物体边界,因此在某些场景下可能将邻近物体错误地归为同一聚类。本文提出了一种新概念——“区域纯度”(regional purity),定义为在固定半径的3D空间内,邻近点中属于同一实例的比例。直观上,该指标反映了某一点位于物体边界区域的可能性。为验证预测区域纯度的可行性,我们设计了一种基于现有训练数据构建随机场景模拟数据集的策略。此外,利用此类模拟数据进行区域纯度学习,是一种“免费”的数据增强方式,无需额外采集真实数据,从而减轻了数据获取负担。为此,我们提出了区域纯度引导网络(Regional Purity Guided Network, RPGN),该网络包含独立分支以分别预测语义类别、区域纯度、偏移量及物体尺寸。预测得到的区域纯度信息被用于指导聚类算法。实验结果表明,引入区域纯度能够有效同时缓解聚类过程中的欠分割(under-segmentation)与过分割(over-segmentation)问题。