
초록
딥러닝은 형상 분류, 객체 검출, 의미 분할 등 많은 3D 시각 인식 작업에서 놀라운 성공을 거두었습니다. 그러나 이러한 결과의 대부분은 매우 시간이 많이 소요되고 비용이 많이 드는 실제 세계의 밀집 주석 3D 데이터를 수작업으로 수집하는 것에 의존하고 있어, 3D 인식 작업의 확장성을 제한하고 있습니다. 따라서 우리는 비지도 3D 인식을 연구하고, 자기 지도-자기 라벨링 3D 인식 (Self-supervised-Self-Labeled 3D Recognition, SL3D) 프레임워크를 제안합니다. SL3D는 클러스터링과 특징 표현 학습이라는 두 가지 결합된 목표를 동시에 해결하여 비지도 3D 인식을 위한 가짜 라벨 데이터를 생성합니다. SL3D는 일반적인 프레임워크로, 분류, 객체 검출, 의미 분할 등 다양한 3D 인식 작업을 해결하는 데 적용될 수 있습니다. 광범위한 실험을 통해 그 효과성이 입증되었습니다. 코드는 https://github.com/fcendra/sl3d에서 확인할 수 있습니다.