2달 전

단안 3D 객체 검출: 정확한 제안과 형태 재구성을 활용하여

Jason Ku; Alex D. Pon; Steven L. Waslander
단안 3D 객체 검출: 정확한 제안과 형태 재구성을 활용하여
초록

우리는 단일 카메라를 이용한 3D 객체 검출 방법인 MonoPSR을 소개합니다. 이 방법은 제안(proposals)과 형태 재구성을 활용합니다. 먼저, 핀홀 카메라 모델의 기본 관계를 사용하여 성숙한 2D 객체 검출기에서 얻은 검출 결과를 바탕으로 장면 내 각 객체에 대한 3D 제안을 생성합니다. 이러한 제안들의 3D 위치는 매우 정확하여 최종 3D 바운딩 박스 검출의 회귀(regression) 난이도를 크게 줄입니다. 동시에, 객체 중심 좌표계에서 점 클라우드(point cloud)를 예측하여 로컬 스케일과 형태 정보를 학습합니다. 그러나 주요 과제는 형태 정보를 어떻게 활용하여 3D 위치 결정을 안내할 것인가입니다. 이를 위해, 우리는 새로운 투영 일치 손실(projection alignment loss)을 포함하는 집합 손실(aggregate losses)을 설계하여 신경망에서 이러한 작업들을 공동으로 최적화함으로써 3D 위치 결정의 정확도를 향상시킵니다. KITTI 벤치마크에서 우리의 방법을 검증한 결과, 이미 출판된 단일 카메라 기반 방법들 중 가장 뛰어난 성능을 달성하였으며, 보행자와 자전거 운전자 클래스에서도 우수한 결과를 얻었으며 효율적인 실행 시간을 유지하였습니다.

단안 3D 객체 검출: 정확한 제안과 형태 재구성을 활용하여 | 최신 연구 논문 | HyperAI초신경