11일 전
일반화된 3D 특징 끌어오기 기반 다중 시점 보행자 탐지 성능 향상
{Junghyun Cho, Hyungjoo Jung, Haesol Park, Sithu Aung}

초록
다중 시점 보행자 탐지의 주요 과제는 시점별 특징을 통합된 공간으로 융합하여 종합적인 엔드투엔드 인식을 가능하게 하는 것이다. 기존의 다중 시점 탐지 방법들은 주로 시점별 특징을 지면에 투영함으로써 장면에 대한 '새로운 시점 보기'(Bird's Eye View, BEV) 표현을 생성하는 데 초점을 맞추어왔다. 본 논문은 비모수적 3차원 특징 끌어오기(3D feature-pulling) 전략을 활용하는 간단하면서도 효과적인 아키텍처를 제안한다. 이 전략은 3차원 특징 볼륨 내 각 유효 박스(voxel)에 대해 직접 해당되는 2차원 특징을 추출함으로써, 이전 방법에서 발생할 수 있는 특징 손실 문제를 해결한다. 제안하는 프레임워크는 다중 시점 탐지 시스템의 일반화 능력을 강화하기 위해 설계된 세 가지 새로운 모듈을 도입한다. 광범위한 실험을 통해 제안된 모델의 유효성을 입증하였으며, 전통적인 시나리오뿐 아니라 장면 일반화 벤치마크에서 새로운 최고 성능을 달성함을 보였다.