11일 전

단안 3D 객체 탐지를 위한 범주형 깊이 분포 네트워크

Cody Reading, Ali Harakeh, Julia Chae, Steven L. Waslander
단안 3D 객체 탐지를 위한 범주형 깊이 분포 네트워크
초록

단안 3차원 객체 탐지(3D object detection)는 다중 센서 시스템에 비해 구성이 간단한 장점으로 자율주행 차량에서 핵심적인 문제로 여겨진다. 단안 3D 탐지의 주요 과제는 직접적인 거리 측정이 불가능한 상황에서 객체의 깊이를 정확히 예측하는 것이다. 이는 객체 및 장면의 특징 정보를 기반으로 깊이를 추론해야 하기 때문이다. 많은 기존 방법들이 3D 탐지에 도움을 주기 위해 깊이를 직접 추정하려는 시도를 하지만, 깊이 예측의 부정확성으로 인해 성능이 제한적이다. 본 연구에서 제안하는 Categorical Depth Distribution Network(CaDDN)는 각 픽셀에 대해 예측된 범주형 깊이 분포를 사용하여 3D 공간 내 적절한 깊이 구간에 풍부한 맥락 정보를 투영한다. 이후 계산 효율성이 높은 베이드아이뷰(Bird's-eye-view) 투영과 단계별(single-stage) 탐지기(detector)를 활용하여 최종 출력 박스를 생성한다. CaDDN은 깊이 추정과 객체 탐지의 공동 최적화를 위한 완전히 미분 가능한 엔드투엔드(end-to-end) 아키텍처로 설계되었다. 제안한 방법은 KITTI 3D 객체 탐지 벤치마크에서 공개된 단안 방법들 중 1위를 기록하며 성능을 입증하였다. 또한, 최신 공개된 Waymo Open Dataset에 대해 최초로 단안 3D 탐지 결과를 제시하였다. CaDDN의 코드는 공개되어 사용이 가능하다.

단안 3D 객체 탐지를 위한 범주형 깊이 분포 네트워크 | 최신 연구 논문 | HyperAI초신경