2달 전

다중 뷰 3D 객체 검출을 위한 효율적인 객체 중심 시계열 모델링 탐구

Wang, Shihao ; Liu, Yingfei ; Wang, Tiancai ; Li, Ying ; Zhang, Xiangyu
다중 뷰 3D 객체 검출을 위한 효율적인 객체 중심 시계열 모델링 탐구
초록

본 논문에서는 다중 시점 3D 객체 검출을 위한 장기 시퀀스 모델링 프레임워크인 StreamPETR를 제안합니다. PETR 시리즈의 희소 쿼리 설계를 기반으로 하여, 우리는 체계적으로 객체 중심의 시간적 메커니즘을 개발하였습니다. 이 모델은 온라인 방식으로 수행되며, 장기적인 역사 정보는 객체 쿼리를 통해 프레임별로 전파됩니다. 또한, 객체의 움직임을 모델링하기 위해 동작 인식 레이어 정규화(Motion-aware Layer Normalization)를 도입하였습니다. StreamPETR는 단일 프레임 베이스라인과 비교하여 미미한 계산 비용으로도 상당한 성능 향상을 달성하였습니다. 표준 nuScenes 벤치마크에서, StreamPETR은 LiDAR 기반 방법과 유사한 성능(67.6% NDS 및 65.3% AMOTA)을 달성하는 첫 번째 온라인 다중 시점 방법입니다. 경량 버전은 45.0% mAP와 31.7 FPS를 실현하며, 최신 기술(SOLOFusion)보다 2.3% mAP가 높고 1.8배 더 빠른 FPS를 제공합니다. 코드는 https://github.com/exiawsh/StreamPETR.git에서 이용 가능합니다.

다중 뷰 3D 객체 검출을 위한 효율적인 객체 중심 시계열 모델링 탐구 | 최신 연구 논문 | HyperAI초신경