2달 전

단일 카메라 비디오에서의 운동학적 3D 객체 검출

Garrick Brazil; Gerard Pons-Moll; Xiaoming Liu; Bernt Schiele
단일 카메라 비디오에서의 운동학적 3D 객체 검출
초록

3D로 물리적 세계를 인식하는 것은 자율 주행 애플리케이션에 있어 근본적인 요소입니다. 시간적 움직임은 인간의 시각에서 검출, 추적, 그리고 깊이 인식을 위해 매우 중요한 자원이지만, 이러한 특징들은 현대의 3D 객체 검출기에서 충분히 활용되지 않았습니다. 본 연구에서는 단일 카메라 비디오 기반의 3D 객체 검출을 위한 새로운 방법을 제안합니다. 이 방법은 운동학적 움직임을 신중하게 활용하여 3D 위치 결정의 정밀도를 향상시키는 데 초점을 맞추고 있습니다. 구체적으로, 우리는 객체 방향의 새로운 분해법과 자기 균형화된 3D 신뢰도를 제안합니다. 우리는 이러한 두 구성요소가 우리의 운동학 모델이 효과적으로 작동하도록 하는데 핵심적이라는 것을 보여줍니다. 총합적으로, 단 하나의 모델만으로도 우리는 단일 카메라 비디오로부터 3D 운동학을 효율적으로 활용하여 3D 객체 검출에서 전체적인 위치 결정 정밀도를 개선할 수 있으며, 동시에 장면 역학(자기 운동과 개별 객체 속도)의 유용한 부산물을 생성합니다. 우리는 KITTI 자율 주행 데이터셋 내에서 단일 카메라 기반 3D 객체 검출 및 새눈시점(Bird's Eye View) 작업에서 최고 수준의 성능을 달성하였습니다.

단일 카메라 비디오에서의 운동학적 3D 객체 검출 | 최신 연구 논문 | HyperAI초신경