11일 전

BEVHeight: 시각 기반 도로변 3D 객체 탐지를 위한 강건한 프레임워크

Lei Yang, Kaicheng Yu, Tao Tang, Jun Li, Kun Yuan, Li Wang, Xinyu Zhang, Peng Chen
BEVHeight: 시각 기반 도로변 3D 객체 탐지를 위한 강건한 프레임워크
초록

최근 자율주행 시스템의 대부분은 자차 내부 센서를 기반으로 한 인식 기법 개발에 주력하고 있으나, 시각 범위를 넘어서는 인식 능력을 확장하기 위해 지능형 도로변 카메라를 활용하는 대안적 접근법에 대한 관심이 부족한 편이다. 본 연구에서는 최신의 시각 중심형 Bird's Eye View(BEV) 객체 탐지 기법이 도로변 카메라 환경에서 뛰어난 성능을 보이지 못함을 발견하였다. 이는 기존 방법들이 카메라 중심에서의 깊이 정보를 회복하는 데 집중하기 때문에, 차량과 지면 사이의 깊이 차이가 거리 증가에 따라 급격히 감소하기 때문이며, 이는 도로변 카메라의 특성과 부합하지 않는다. 본 논문에서는 이러한 문제를 해결하기 위해 간단하면서도 효과적인 접근법인 BEVHeight를 제안한다. 본 방법은 픽셀 단위의 깊이를 예측하는 대신, 카메라에서 지면까지의 높이를 회귀함으로써 거리에 민감하지 않은 공식을 도입하여, 단일 카메라 기반 인식 기법의 최적화 과정을 용이하게 한다. 도로변 카메라를 대상으로 한 주요 3D 객체 탐지 벤치마크에서 본 방법은 이전의 모든 시각 중심 기법을 크게 앞서는 성능을 기록하였다. 코드는 {\url{https://github.com/ADLab-AutoDrive/BEVHeight}}에서 공개되어 있다.

BEVHeight: 시각 기반 도로변 3D 객체 탐지를 위한 강건한 프레임워크 | 최신 연구 논문 | HyperAI초신경