2달 전
Deep Multi-View Pedestrian Detection에 일반화를 적용하기
Vora, Jeet ; Dutta, Swetanjal ; Jain, Kanishk ; Karthik, Shyamgopal ; Gandhi, Vineet

초록
다중 시점 감지(Multi-view Detection, MVD)는 혼잡한 환경에서 가림 처리에 매우 효과적입니다. 최근 딥러닝을 활용한 연구들은 이 분야에서 상당한 진전을 이루었지만, 일반화 측면을 간과하여 실제 현장 배포에는 실용적이지 못했습니다. 본 연구의 핵심적인 혁신은 세 가지 중요한 일반화 형태를 체계화하고 이를 평가하기 위한 실험을 제안하는 것입니다: 1) 카메라 수의 변화에 대한 일반화, 2) 카메라 위치의 변화에 대한 일반화, 그리고 마지막으로 3) 새로운 장면으로의 일반화입니다. 우리는 기존 최고 성능 모델들이 단일 장면과 카메라 설정에 과적합되어 있어 빈약한 일반화 능력을 보임을 발견하였습니다. 이러한 문제를 해결하기 위해: (a) 다양한 장면, 주간 시간대 변화, 카메라 설정 변화, 카메라 수 변화 등을 포함하는 새로운 Generalized MVD (GMVD) 데이터셋을 제안하며, (b) MVD에 일반화를 도입하기 위한 필수적인 속성을 논의하고 이를 통합할 수 있는 기본적인 모델을 제안합니다. WildTrack, MultiViewX, GMVD 데이터셋을 사용하여 포괄적인 실험을 수행하여 MVD 방법들의 일반화 능력을 평가할 필요성을 강조하고 제안된 접근 방식의 유효성을 입증하였습니다. 코드와 제안된 데이터셋은 https://github.com/jeetv/GMVD에서 확인할 수 있습니다.