15일 전

CenterFormer: 3D 객체 탐지를 위한 중심 기반 트랜스포머

Zixiang Zhou, Xiangchen Zhao, Yu Wang, Panqu Wang, Hassan Foroosh
CenterFormer: 3D 객체 탐지를 위한 중심 기반 트랜스포머
초록

쿼리 기반 트랜스포머는 여러 이미지 영역 작업에서 장거리 주의(attention) 구축에 큰 잠재력을 보여왔지만, 포인트 클라우드 데이터의 엄청난 크기로 인해 라이다 기반 3차원 객체 탐지에서는 거의 고려되지 않았다. 본 논문에서는 3차원 객체 탐지를 위한 중심 기반 트랜스포머 네트워크인 CenterFormer을 제안한다. CenterFormer은 표준 복셀 기반 포인트 클라우드 인코더 위에서 중심 히트맵을 사용하여 중심 후보를 선별한 후, 중심 후보의 특징을 트랜스포머 내 쿼리 임베딩으로 활용한다. 또한 다중 프레임에서의 특징을 더욱 효과적으로 통합하기 위해 교차 주의( cross-attention)를 통한 특징 융합 방식을 설계하였다. 마지막으로 출력된 중심 특징 표현 위에서 경계 박스를 예측하기 위한 회귀 헤드를 추가한다. 본 연구의 설계는 트랜스포머 구조의 수렴 난이도와 계산 복잡도를 감소시킨다. 실험 결과, 앵커리스 객체 탐지 네트워크의 강력한 베이스라인 대비 눈에 띄는 성능 향상을 보였다. CenterFormer은 Waymo Open Dataset에서 단일 모델 기준으로 최신 기술 수준의 성능을 달성하였으며, 검증 세트에서 73.7%의 mAPH, 테스트 세트에서 75.6%의 mAPH를 기록하여 이전에 발표된 모든 CNN 및 트랜스포머 기반 방법들을 크게 능가하였다. 본 연구의 코드는 공개되어 있으며, https://github.com/TuSimple/centerformer 에서 확인할 수 있다.

CenterFormer: 3D 객체 탐지를 위한 중심 기반 트랜스포머 | 최신 연구 논문 | HyperAI초신경