2 个月前

SL3D:自监督自标注三维识别

Fernando Julio Cendra; Lan Ma; Jiajun Shen; Xiaojuan Qi
SL3D:自监督自标注三维识别
摘要

深度学习在许多三维视觉识别任务中取得了显著的成功,包括形状分类、物体检测和语义分割。然而,这些成果大多依赖于人工收集密集注释的真实世界三维数据,这不仅耗时且成本高昂,限制了三维识别任务的可扩展性。因此,我们研究了无监督三维识别,并提出了一种自监督自标记三维识别(SL3D)框架。SL3D 同时解决了两个耦合目标,即聚类和学习特征表示,以生成用于无监督三维识别的伪标签数据。SL3D 是一个通用框架,可以应用于解决不同的三维识别任务,包括分类、物体检测和语义分割。广泛的实验验证了其有效性。代码可在 https://github.com/fcendra/sl3d 获取。