비지도 3D 학습을 통한 형상 분석: 다중 해상도 인스턴스 구분을 활용하여

비록 비지도 특성 학습이 많은 분야에서 데이터 라벨링과 네트워크 설계의 작업량을 줄이는 데 그 장점을 입증하였지만, 기존의 비지도 3D 학습 방법들은 여전히 감독된 방법에 필적하는 성능으로 다양한 형태 분석 작업을 수행할 수 있는 일반적인 네트워크를 제공하지 못하고 있습니다. 본 논문에서는 다양한 형태 분석 작업을 위한 일반적이고 효율적인 형태 인코딩 네트워크를 학습하기 위한 비지도 방법을 제안합니다. 우리 방법의 핵심 아이디어는 라벨이 부여되지 않은 3D 포인트 클라우드에서 형태와 점 특성을 동시에 인코딩하고 학습하는 것입니다. 이를 위해 우리는 HR-Net을 옥트리 기반 컨볼루셔널 신경망에 적응시켜, 융합된 다중 해상도 서브네트워크를 사용하여 형태와 점 특성을 동시에 인코딩하도록 설계하였습니다. 또한, 단순하면서도 효율적인 다중 해상도 인스턴스 구분(Multiresolution Instance Discrimination, MID) 손실 함수를 설계하여 형태와 점 특성을 동시에 학습하였습니다. 우리의 네트워크는 3D 포인트 클라우드를 입력으로 받아 형태와 점 특성을 모두 출력합니다. 훈련 후, 이 네트워크는 간단한 작업별 백엔드 계층과 연결되어 다양한 형태 분석 작업에 대해 미세 조정됩니다. 우리는 본 방법의 효과성과 일반성을 평가하기 위해, 형태 분류, 의미론적 형태 세그멘테이션 및 형태 등록 작업 등을 포함한 일련의 형태 분석 작업을 통해 네트워크와 손실 함수 설계를 검증하였습니다. 간단한 백엔드를 사용함에도 불구하고, 우리의 네트워크는 모든 비지도 방법 중 최고의 성능을 보였으며 특히 라벨이 부여된 데이터셋이 작은 작업에서 감독된 방법과 경쟁력 있는 성능을 달성하였습니다. 미세한 형태 세그멘테이션 작업에서는 우리 방법이 기존의 감독된 방법보다 크게 우수한 결과를 보였습니다.