단안형 준밀도 3D 객체 추적

자율 주행과 같은 다양한 응용 분야에서 주변 물체의 미래 위치를 예측하고 관측자의 행동을 계획하기 위해서는 신뢰성 있고 정확한 3차원(3D) 추적 프레임워크가 필수적이다. 본 연구에서는 이동 플랫폼에서 촬영한 2D 이미지 시퀀스로부터 움직이는 물체를 시간에 따라 효과적으로 연결하고, 물체의 전체 3D 경계 상자(bounding box) 정보를 추정할 수 있는 프레임워크를 제안한다. 물체 간 연결은 외형 특징에만 의존하여 다양한 자세와 시점에서의 물체를 식별할 수 있도록 사밀도(similar) 기반 유사도 학습 기법을 활용한다. 초기 2D 연결 이후, 3D 경계 상자의 깊이 순서 히ュ리스틱을 이용한 강건한 인스턴스 연결과 운동 기반 3D 궤적 예측을 통해 가려진 차량의 재식별을 수행한다. 마지막으로, LSTM 기반의 물체 속도 학습 모듈을 통해 장기적인 궤적 정보를 통합하여 더 정확한 운동 외삽을 실현한다. 제안한 시뮬레이션 데이터와 실제 환경 벤치마크(KITTI, nuScenes, Waymo 데이터셋 포함)에서의 실험 결과, 본 추적 프레임워크가 도심 주행 시나리오에서 강건한 물체 연결 및 추적 성능을 제공함을 입증하였다. 특히 Waymo Open 벤치마크에서는 3D 추적 및 3D 탐지 과제에서 카메라 단일 모달 기반의 최초 베이스라인을 설정하였다. nuScenes 3D 추적 벤치마크에서는 기존 발표된 모든 비전 중심 방법 중 최고 성능을 기록한 제안에 비해 거의 5배에 가까운 추적 정확도 향상을 달성하였다. 본 연구의 코드, 데이터 및 학습된 모델은 https://github.com/SysCV/qd-3dt 에서 공개되어 있다.