3달 전

시간적 맥락을 강화한 심하게 가려진 보행자 탐지

{ Junsong Yuan, Yuan Li, Qian Zhang, Ming Yang, Chunluan Zhou, Jialian Wu}
시간적 맥락을 강화한 심하게 가려진 보행자 탐지
초록

최근의 최첨단 보행자 탐지기들은 비차폐 보행자에 대해 유망한 성능을 보였지만, 여전히 심각한 차폐 상황에 직면해 있다. 이전의 많은 연구들이 보행자 차폐 문제를 완화하려는 노력을 기울였지만, 대부분은 정적 이미지에 기반하고 있다. 본 논문에서는 영상에서 보행자의 국소적 시간적 맥락을 활용하여, 심각한 차폐에 대응할 수 있도록 보강된 보행자 탐지 성능을 달성하고자 하는 튜브 특징 집약 네트워크(TFAN, Tube Feature Aggregation Network)를 제안한다. 구체적으로, 현재 프레임에서 차폐된 보행자에 대해 시간 축을 따라 반복적으로 관련된 대응 항목을 탐색하여 튜브를 형성한다. 이후, 이 튜브로부터 추출된 특징들은 적응형 가중치에 따라 집약되어 차폐된 보행자의 특징 표현을 강화한다. 더불어, 본 연구는 튜브의 이동 문제(튜브 드리프트)와 심각한 차폐 상황에 더 잘 대응할 수 있도록 시간적 구분 임베딩 모듈(TDEM, Temporally Discriminative Embedding Module)과 부분 기반 관계 모듈(PRM, Part-based Relation Module)을 각각 설계하였다. 다양한 실험을 Caltech, NightOwls, KAIST 세 가지 데이터셋에서 수행한 결과, 제안하는 방법이 심각한 차폐 상황에서의 보행자 탐지에 크게 효과적임을 입증하였다. 또한, Caltech 및 NightOwls 데이터셋에서 최신 기술(SOTA, State-of-the-Art) 수준의 성능을 달성하였다.