2달 전

SVT-Net: 대규모 장소 인식을 위한 초경량 희소 복셀 변환기

Fan, Zhaoxin ; Song, Zhenbo ; Liu, Hongyan ; Lu, Zhiwu ; He, Jun ; Du, Xiaoyong
SVT-Net: 대규모 장소 인식을 위한 초경량 희소 복셀 변환기
초록

포인트 클라우드 기반 대규모 장소 인식은 동시 정위 및 매핑(SLAM)과 같은 많은 응용 분야에서 기본적입니다. 많은 모델이 제안되어 단거리 로컬 특징을 학습하여 좋은 성능을 달성하였지만, 장거리 문맥적 특징은 종종 간과되었습니다. 또한, 모델의 크기가 그들의 광범위한 응용에 있어 병목 요인이 되고 있습니다. 이러한 도전 과제를 극복하기 위해, 우리는 대규모 장소 인식을 위한 초경량 네트워크 모델인 SVT-Net을 제안합니다. 구체적으로, 매우 효율적인 3D 희소 컨볼루션(SP-Conv) 위에서 원자 기반 희소 보케일 트랜스포머(ASVT)와 클러스터 기반 희소 보케일 트랜스포머(CSVT)가 제안되어 이 모델에서 단거리 로컬 특징과 장거리 문맥적 특징을 모두 학습할 수 있도록 설계되었습니다. ASVT와 CSVT로 구성된 SVT-Net은 벤치마크 데이터셋에서 정확도와 속도 측면에서 최고 수준의 성능을 달성하면서도 초경량 모델 크기(0.9M)를 유지합니다. 또한, 두 개의 단순화된 SVT-Net 버전이 소개되었으며, 이들 역시 최고 수준의 성능을 달성하며 모델 크기를 각각 0.8M와 0.4M로 더욱 줄였습니다.