11일 전

보정이 필요 없는 인프라 인식을 위한 BEV 표현

Siqi Fan, Zhe Wang, Xiaoliang Huo, Yan Wang, Jingjing Liu
보정이 필요 없는 인프라 인식을 위한 BEV 표현
초록

인프라에 설치된 카메라를 통한 효과적인 BEV(鳥瞰도) 객체 탐지 는 교통 환경 이해 및 차량-인프라(V2I) 협업 인지 능력을 크게 향상시킬 수 있다. 그러나 인프라에 설치된 카메라의 설치 각도는 다양하며, 기존의 BEV 탐지 방법은 정확한 캘리브레이션에 의존하므로 바람이나 눈과 같은 자연 요인으로 인해 불가피하게 발생하는 오차로 인해 실용적 적용에 어려움이 있다. 본 논문에서는 캘리브레이션 파라미터와 추가적인 깊이 감독 없이 BEV 표현 기반 3차원 탐지를 달성하는 캘리브레이션 불필요 BEV 표현(CBR) 네트워크를 제안한다. 구체적으로, 박스에 의해 유도된 전경 감독 하에 다층 퍼셉트론을 두 개 사용하여 원근 시점의 특징을 전면 시점과 벌거지 시점으로 분리한다. 이후, 정사각형 시점 간의 특징을 유사도 기반으로 매칭하고, 전면 시점 특징을 활용하여 BEV 특징을 강화하는 크로스뷰 특징 융합 모듈을 도입한다. DAIR-V2X 데이터셋에서의 실험 결과, CBR는 어떠한 카메라 파라미터 없이도 만족스러운 성능을 달성하며, 캘리브레이션 노이즈에 자연스럽게 영향을 받지 않는다는 점을 입증하였다. 향후 인프라 인지의 실용적 도전 과제를 해결하는 연구의 기초가 될 수 있기를 기대한다.

보정이 필요 없는 인프라 인식을 위한 BEV 표현 | 최신 연구 논문 | HyperAI초신경