LION: 3D 포인트 클라우드에서 객체 검출을 위한 선형 그룹 RNN

트랜스포머가 대규모 3D 포인트 클라우드 인식 작업, 예를 들어 3D 객체 검출에서 장거리 관계 모델링 시 이차 계산 비용으로 인해 이점이 제한적입니다. 반면, 선형 RNN은 낮은 계산 복잡도를 가지고 있어 장거리 모델링에 적합합니다. 이를 위해, 우리는 정확한 3D 객체 검출을 위한 선형 그룹 RNN(LInear grOup RNN, 즉 그룹화된 특징에 대해 선형 RNN을 수행) 기반의 간단하고 효과적인 윈도우 기반 프레임워크를 제안하며, 이를 LION이라고 명명하였습니다. 핵심 특성은 트랜스포머 기반 방법보다 훨씬 더 큰 그룹에서 충분한 특징 상호작용을 허용하는 것입니다. 그러나 고도로 희소한 포인트 클라우드에서 선형 그룹 RNN을 효과적으로 적용하는 것은 공간 모델링 처리 능력의 한계로 인해 쉽지 않습니다. 이 문제를 해결하기 위해, 우리는 단순히 3D 공간 특징 설명자를 도입하여 선형 그룹 RNN 연산자에 통합하여 복셀 특징의 스캔 순서를 무작정 증가시키는 대신 공간 특징을 강화하였습니다. 또한 고도로 희소한 포인트 클라우드의 과제를 더욱 해결하기 위해, 선형 그룹 RNN의 자기 회귀 모델의 자연스러운 속성을 활용하여 전경 특징을 밀집화하는 3D 복셀 생성 전략을 제안하였습니다. 광범위한 실험 결과는 제안된 구성 요소들의 효과와 Mamba, RWKV, RetNet 등 다양한 선형 그룹 RNN 연산자에서 LION의 일반화 능력을 확인해주었습니다. 특히 LION-Mamba는 Waymo, nuScenes, Argoverse V2, ONCE 데이터셋에서 최고 수준의 성능을 달성하였음을 언급할 가치가 있습니다. 마지막으로, 우리의 방법은 KITTI 데이터셋과 같은 작은 하지만 인기 있는 데이터셋에서도 빠른 경험을 제공하기 위해 RetNet, RWKV, Mamba, xLSTM 및 TTT와 같은 고급 선형 RNN 연산자를 지원합니다.