3달 전

기하학 기반 거리 분해를 통한 단안 3D 객체 탐지

Xuepeng Shi, Qi Ye, Xiaozhi Chen, Chuangrong Chen, Zhixiang Chen, Tae-Kyun Kim
기하학 기반 거리 분해를 통한 단안 3D 객체 탐지
초록

단안 3D 객체 탐지 기술은 자율주행 분야에서 매우 중요한 의미를 지니고 있으나 여전히 도전적인 과제로 남아 있다. 핵심 과제는 명시적인 깊이 정보가 없는 환경에서 객체의 거리를 예측하는 것이다. 기존 대부분의 방법들이 거리를 단일 변수로 회귀하는 방식을 취하는 것과 달리, 본 연구에서는 거리를 그 구성 요소로 분해하는 기하학 기반의 새로운 거리 분해 기법을 제안한다. 이 분해 방법은 객체의 거리를 가장 대표적이고 안정적인 변수들—즉, 물리적 높이와 이미지 평면 상의 투영된 시각적 높이—로 분해함으로써 거리를 복원한다. 또한, 두 높이 간의 자기 일관성을 유지함으로써, 예측된 두 높이 값이 모두 정확하지 않을 경우에도 거리 예측이 안정적으로 이루어질 수 있도록 한다. 더불어, 이 분해 방식을 통해 다양한 시나리오에서 거리 예측의 불확실성 원인을 추적할 수 있게 된다. 이러한 분해 기법은 거리 예측의 해석 가능성, 정확성, 그리고 강인성을 동시에 확보한다. 제안된 방법은 RGB 이미지에서 직접 3D 경계 상자(3D bounding box)를 예측하며, 간결한 아키텍처를 사용하여 학습 및 추론 과정을 간편하고 효율적으로 구현한다. 실험 결과, 본 방법은 KITTI 데이터셋의 단안 3D 객체 탐지 및 바이드 아이뷰(Birds Eye View) 작업에서 최신 기술 수준의 성능을 달성하였으며, 카메라 내부 파라미터가 다른 이미지에 대해서도 일반화 가능함을 입증하였다.