11일 전

LiDAR 기반 3D 인식을 위한 구형 Transformer

Xin Lai, Yukang Chen, Fanbin Lu, Jianhui Liu, Jiaya Jia
LiDAR 기반 3D 인식을 위한 구형 Transformer
초록

LiDAR 기반 3차원 포인트 클라우드 인식은 다양한 응용 분야에 기여해왔다. 현재 대부분의 방법들은 LiDAR 포인트 분포를 특별히 고려하지 않아 정보의 단절과 제한된 수용 영역 문제를 겪고 있으며, 특히 희소한 원거리 포인트에 있어서 이 문제가 더욱 심각하다. 본 연구에서는 LiDAR 포인트의 변동하는 희소성 분포를 분석하고, 밀도가 높은 근거리 포인트로부터 희소한 원거리 포인트로 직접 정보를 집계할 수 있는 SphereFormer을 제안한다. 우리는 공간을 겹치지 않는 좁고 긴 윈도우로 분할하는 반경 방향 윈도우 자기주의(self-attention)를 설계하여, 정보 단절 문제를 해결하고 수용 영역을 부드럽고 극적으로 확장함으로써 희소한 원거리 포인트의 성능을 크게 향상시켰다. 또한 좁고 긴 윈도우 구조에 적합하도록, 세밀한 위치 인코딩을 얻기 위한 지수 분할(Exponential Splitting)과 모델 표현 능력을 향상시키기 위한 동적 특징 선택 기법을 제안한다. 특히 본 연구 방법은 nuScenes와 SemanticKITTI 세분화 분류 벤치마크에서 각각 81.9%, 74.8%의 mIoU로 1위를 기록하였으며, nuScenes 객체 탐지 벤치마크에서는 NDS 72.8%, mAP 68.5%로 3위를 달성하였다. 코드는 https://github.com/dvlab-research/SphereFormer.git 에 공개되어 있다.

LiDAR 기반 3D 인식을 위한 구형 Transformer | 최신 연구 논문 | HyperAI초신경