11일 전
BEVHeight: 시각 기반 도로변 3D 객체 탐지를 위한 강건한 프레임워크
Lei Yang, Kaicheng Yu, Tao Tang, Jun Li, Kun Yuan, Li Wang, Xinyu Zhang, Peng Chen

초록
최근 자율주행 시스템의 대부분은 자차 내부 센서를 기반으로 한 인식 기법 개발에 주력하고 있으나, 시각 범위를 넘어서는 인식 능력을 확장하기 위해 지능형 도로변 카메라를 활용하는 대안적 접근법에 대한 관심이 부족한 편이다. 본 연구에서는 최신의 시각 중심형 Bird's Eye View(BEV) 객체 탐지 기법이 도로변 카메라 환경에서 뛰어난 성능을 보이지 못함을 발견하였다. 이는 기존 방법들이 카메라 중심에서의 깊이 정보를 회복하는 데 집중하기 때문에, 차량과 지면 사이의 깊이 차이가 거리 증가에 따라 급격히 감소하기 때문이며, 이는 도로변 카메라의 특성과 부합하지 않는다. 본 논문에서는 이러한 문제를 해결하기 위해 간단하면서도 효과적인 접근법인 BEVHeight를 제안한다. 본 방법은 픽셀 단위의 깊이를 예측하는 대신, 카메라에서 지면까지의 높이를 회귀함으로써 거리에 민감하지 않은 공식을 도입하여, 단일 카메라 기반 인식 기법의 최적화 과정을 용이하게 한다. 도로변 카메라를 대상으로 한 주요 3D 객체 탐지 벤치마크에서 본 방법은 이전의 모든 시각 중심 기법을 크게 앞서는 성능을 기록하였다. 코드는 {\url{https://github.com/ADLab-AutoDrive/BEVHeight}}에서 공개되어 있다.