17일 전

V2F-Net: 가려진 보행자 탐지의 명시적 분해

Mingyang Shang, Dawei Xiang, Zhicheng Wang, Erjin Zhou
V2F-Net: 가려진 보행자 탐지의 명시적 분해
초록

보행자 탐지에서 가림 현상은 매우 도전적인 문제이다. 본 논문에서는 가림된 보행자 탐지를 명시적으로 '가시 영역 탐지'와 '전신 박스 추정'으로 분해하는 간단하면서도 효과적인 방법인 V2F-Net을 제안한다. V2F-Net은 두 개의 하위 네트워크로 구성되며, 각각 가시 영역 탐지 네트워크(Visible region Detection Network, VDN)와 전신 추정 네트워크(Full body Estimation Network, FEN)이다. VDN은 가시 영역을 정확히 위치 추정하려고 하며, FEN은 가시 영역 박스를 기반으로 전신 박스를 추정한다. 또한, 전신 추정 성능을 추가로 향상시키기 위해, 새로운 임베딩 기반의 부분 인지 모듈(Embedding-based Part-aware Module, EPM)을 제안한다. 각 부분에 대한 가시성 정보를 감독함으로써, 네트워크는 핵심적인 부분 정보를 포함한 특징을 추출하도록 유도된다. 두 개의 도전적인 데이터셋에서 여러 실험을 수행함으로써 V2F-Net의 효과성을 실험적으로 입증하였다. FPN 기준선 대비, V2F-Net은 CrowdHuman에서 5.85%의 AP 향상과 CityPersons에서 2.24%의 MR-2 개선을 달성하였다. 또한, 단일 단계 및 이중 단계 탐지기 모두에서 일관된 성능 향상이 관찰되어 본 방법의 일반화 가능성을 입증하였다.