2달 전

Mamba3D: 상태 공간 모델을 통한 3D 포인트 클라우드 분석의 로컬 특성 강화

Han, Xu ; Tang, Yuan ; Wang, Zhaoxuan ; Li, Xianzhi
Mamba3D: 상태 공간 모델을 통한 3D 포인트 클라우드 분석의 로컬 특성 강화
초록

기존의 포인트 클라우드 분석을 위한 트랜스포머 기반 모델들은 이차 복잡도를 가지고 있어, 포인트 클라우드 해상도가 저하되고 정보 손실이 발생하는 문제가 있습니다. 이에 반해, 상태 공간 모델(SSM)을 기반으로 새롭게 제안된 맘바(Mamba) 모델은 선형 복잡도로 트랜스포머보다 여러 측면에서 우수한 성능을 보입니다. 그러나, 맘바를 포인트 클라우드 작업에 직접적으로 적용하면 만족할 만한 성능을 얻지 못합니다. 본 연구에서는 로컬 피처 추출을 강화하여 우수한 성능, 높은 효율성, 그리고 확장 가능성을 달성하기 위해 포인트 클라우드 학습에 특화된 상태 공간 모델인 맘바3D(Mamba3D)를 소개합니다. 특히, 우리는 간단하면서도 효과적인 로컬 노름 풀링(LNP) 블록을 제안하여 로컬 기하학적 피처를 추출합니다. 또한 더 나은 글로벌 피처를 얻기 위해, 토큰 전방향 SSM과 새로운 후방향 SSM이 특징 채널에서 작동하는 양방향 SSM(bi-SSM)을 도입하였습니다. 광범위한 실험 결과는 맘바3D가 사전 학습 유무와 상관없이 트랜스포머 기반 대응모델들과 동시 연구들보다 여러 작업에서 우월함을 입증하였습니다. 특히, 맘바3D는 ScanObjectNN 데이터셋에서 92.6%(scratch training)의 전체 정확도와 ModelNet40 분류 작업에서 95.1%(단일 모달 사전 학습 포함)의 정확도를 달성하며, 이 모든 것이 선형 복잡도로 이루어졌습니다. 우리의 코드와 가중치는 https://github.com/xhanxu/Mamba3D 에서 확인할 수 있습니다.