11일 전

확률적 및 기하학적 깊이: 원근법에서 객체 탐지

Tai Wang, Xinge Zhu, Jiangmiao Pang, Dahua Lin
확률적 및 기하학적 깊이: 원근법에서 객체 탐지
초록

3D 객체 탐지 는 운전자 보조 시스템과 같은 다양한 실용적 응용 분야에서 필수적인 기능이다. 이미지 기반 접근 방식 중 대표적인 단안(모노클러럴) 3D 탐지는 기존의 라이다(LiDAR)에 의존하는 전통적 방식에 비해 경제적인 솔루션을 제공하지만 여전히 만족스럽지 못한 성능을 보인다. 본 논문은 이 문제에 대해 체계적인 연구를 수행한다. 우리는 현재의 단안 3D 탐지가 인스턴스 깊이 추정 문제로 단순화될 수 있음을 관찰한다. 즉, 정확하지 않은 인스턴스 깊이 추정이 전체 탐지 성능 향상에 대한 모든 다른 3D 속성 예측을 방해한다는 점이다. 또한 최근의 방법들은 서로 다른 객체 간의 기하학적 관계를 무시한 채, 고립된 인스턴스나 픽셀 기반으로 깊이를 직접 추정한다. 이를 해결하기 위해, 예측된 객체들 사이에 기하학적 관계 그래프를 구축하고, 이를 깊이 추정에 활용한다. 이 불안정한 설정에서는 각 인스턴스의 초기 깊이 추정이 일반적으로 정확하지 않기 때문에, 불확실성을 포착하기 위해 확률적 표현을 도입한다. 이는 신뢰할 수 있는 예측을 식별하고, 깊이 전파를 보다 효과적으로 안내하는 중요한 지표가 된다. 기초 아이디어는 단순하지만, 본 연구에서 제안하는 PGD(Probabilistic Graph-based Depth estimation) 방법은 KITTI 및 nuScenes 벤치마크에서 상당한 성능 향상을 달성하며, 단안 비전 기반 방법 중에서 1위를 기록하면서도 실시간 효율성을 유지한다. 코드와 모델은 https://github.com/open-mmlab/mmdetection3d 에 공개될 예정이다.