2달 전
포인트 클라우드 자기 지도 학습을 위한 마스킹 오토인코더
Pang, Yatian ; Wang, Wenxiao ; Tay, Francis E. H. ; Liu, Wei ; Tian, Yonghong ; Yuan, Li

초록
자기 감독 학습의 유망한 방식으로, 마스킹 오토인코딩은 자연어 처리와 컴퓨터 비전 분야에서 크게 발전하였습니다. 이에 영감을 받아, 우리는 점군의 특성으로 인해 발생하는 위치 정보 누수와 정보 밀도의 불균형 등의 문제를 해결하기 위한 점군 자기 감독 학습을 위한 정교한 마스킹 오토인코더 방식을 제안합니다. 구체적으로, 입력 점군을 불규칙한 점 패치로 나누고 높은 비율로 무작위로 마스킹합니다. 그런 다음, 비대칭 설계와 마스킹 토큰 시프팅 연산을 적용한 표준 트랜스포머 기반의 오토인코더가 마스킹되지 않은 점 패치로부터 고차원 잠재 특성을 학습하여 마스킹된 점 패치를 재구성하는 것을 목표로 합니다. 광범위한 실험 결과는 우리의 접근법이 사전 학습 과정에서 효율적이며 다양한 다운스트림 작업에 잘 일반화됨을 보여줍니다. 특히, 우리의 사전 학습 모델은 ScanObjectNN에서 85.18%의 정확도와 ModelNet40에서 94.04%의 정확도를 달성하여 다른 모든 자기 감독 학습 방법들을 능가합니다. 또한, 우리의 방식을 통해 표준 트랜스포머만으로 구성된 간단한 아키텍처가 지도 학습 전용 트랜스포머 모델보다 우수함을 입증하였습니다. 우리의 접근법은 소량 샘플 객체 분류(few-shot object classification)에서 최신 기술(SOTA) 정확도를 1.5%-2.3% 향상시키기도 하였습니다. 더욱이, 우리의 연구는 언어와 이미지에서 사용되는 통합 아키텍처를 점군에 적용할 수 있는 가능성을 제시합니다.