11일 전
보정이 필요 없는 인프라 인식을 위한 BEV 표현
Siqi Fan, Zhe Wang, Xiaoliang Huo, Yan Wang, Jingjing Liu

초록
인프라에 설치된 카메라를 통한 효과적인 BEV(鳥瞰도) 객체 탐지 는 교통 환경 이해 및 차량-인프라(V2I) 협업 인지 능력을 크게 향상시킬 수 있다. 그러나 인프라에 설치된 카메라의 설치 각도는 다양하며, 기존의 BEV 탐지 방법은 정확한 캘리브레이션에 의존하므로 바람이나 눈과 같은 자연 요인으로 인해 불가피하게 발생하는 오차로 인해 실용적 적용에 어려움이 있다. 본 논문에서는 캘리브레이션 파라미터와 추가적인 깊이 감독 없이 BEV 표현 기반 3차원 탐지를 달성하는 캘리브레이션 불필요 BEV 표현(CBR) 네트워크를 제안한다. 구체적으로, 박스에 의해 유도된 전경 감독 하에 다층 퍼셉트론을 두 개 사용하여 원근 시점의 특징을 전면 시점과 벌거지 시점으로 분리한다. 이후, 정사각형 시점 간의 특징을 유사도 기반으로 매칭하고, 전면 시점 특징을 활용하여 BEV 특징을 강화하는 크로스뷰 특징 융합 모듈을 도입한다. DAIR-V2X 데이터셋에서의 실험 결과, CBR는 어떠한 카메라 파라미터 없이도 만족스러운 성능을 달성하며, 캘리브레이션 노이즈에 자연스럽게 영향을 받지 않는다는 점을 입증하였다. 향후 인프라 인지의 실용적 도전 과제를 해결하는 연구의 기초가 될 수 있기를 기대한다.