8일 전

주시하는 시각을 투영하기: 교차 뷰 변환을 통한 단안 도로 장면 레이아웃 추정

{Jia Pan, Shengfeng He, Yuexin Ma, Yuanlong Yu, Wenxi Liu, Qi Li, Weixiang Yang}
주시하는 시각을 투영하기: 교차 뷰 변환을 통한 단안 도로 장면 레이아웃 추정
초록

자율주행을 위한 고정밀 지도(HD map) 재구성은 핵심적인 기술 과제이다. 기존의 LiDAR 기반 방법은 고가의 센서 배치와 계산 시간이 길다는 한계를 가지고 있다. 반면 카메라 기반 접근법은 보통 도로 세그멘테이션과 시점 변환을 별도로 수행해야 하며, 이 과정에서 왜곡이나 콘텐츠 누락이 자주 발생한다. 기술의 한계를 극복하기 위해, 본 연구에서는 단일 전방 단안 영상만을 입력으로 받아 도로 구조 및 차량 점유 영역으로 구성된 지역 지도를 Bird's-Eye View(BEV)로 재구성할 수 있는 새로운 프레임워크를 제안한다. 특히, 서로 다른 시점 간의 사이클 일관성(cycle consistency)을 고려한 크로스뷰 변환 모듈을 제안하여, 시점 간 상관관계를 극대화함으로써 시점 변환 및 장면 이해 성능을 강화하였다. 또한 차량과 도로 간의 관계를 고려하여, 결과를 더욱 정교하게 개선하기 위해 맥락 인지형 판별기(context-aware discriminator)를 설계하였다. 공개 벤치마크에서의 실험 결과, 본 방법은 도로 구조 추정 및 차량 점유 추정이라는 두 가지 과제에서 최신 기술 수준(SOTA)의 성능을 달성하였다. 특히 차량 점유 추정 과제에서는 모든 경쟁 모델을 크게 앞서는 성능을 보였다. 더불어 본 모델은 단일 GPU에서 35 FPS의 속도로 실행 가능하여, 실시간 패노라마 고정밀 지도 재구성에 효율적이고 실용적인 적용이 가능하다.