
摘要
构建三维点云数据集需要大量的人工投入,因此构建大规模三维点云数据集面临巨大挑战。为解决这一问题,我们提出了一种新型的点云分形数据库(PC-FractalDB),该数据库受自然界中三维结构所呈现的分形几何启发,属于一种由公式驱动的监督学习新范式。我们的研究基于一个核心假设:通过学习分形几何,能够从比传统三维数据集更为贴近现实世界的三维模式中提取有效表征。实验结果表明,PC-FractalDB在解决近期三维场景理解领域中的多个数据集相关难题方面具有显著优势,例如三维模型集合构建与耗时的人工标注问题。实验部分显示,相较于当前最先进的方法(如PointContrast、对比场景上下文CSC以及RandomRooms),我们在ScanNetV2和SUN RGB-D数据集上分别实现了最高达61.9%和59.0%的性能表现。此外,PC-FractalDB预训练模型在小样本训练场景下尤为高效。例如,在仅使用ScanNetV2数据集10%训练样本的情况下,基于PC-FractalDB预训练的VoteNet模型仍能达到38.3%的准确率,较CSC方法提升了14.8个百分点。尤为值得注意的是,本方法在有限点云数据条件下进行三维目标检测预训练时,取得了当前最优的性能表现。