7일 전
MovieNet-PS: 자연 환경에서의 대규모 인물 검색 데이터셋
Jie Qin, Peng Zheng, Yichao Yan, Rong Quan, Xiaogang Cheng, Bingbing Ni

초록
사람 검색(Person search)은 자연스럽고 자르지 않은 이미지에서 쿼리 사람을 동시에 위치 추정하고 식별하는 것을 목표로 하며, 최근 몇 년간 적극적으로 연구되어 왔다. 본 논문에서는 대상 사람 주변의 전역적이고 국소적인 풍부한 맥락 정보에 주목한다. 이를 각각 장면 맥락(Scene context)과 그룹 맥락(Group context)이라 부르며, 이전 연구들이 두 맥락 유형을 별도로 다루는 반면, 본 연구는 직관적인 목적인 특징 강화를 위해 통합된 전역-국소 맥락 네트워크(Global-Local Context Network, GLCNet)를 제안한다. 구체적으로, 재식별(Re-ID) 임베딩과 맥락 특징을 다단계 방식으로 동시에 학습함으로써, 사람 검색을 위한 더욱 강화되고 구별력 있는 특징을 도출한다. 제안한 GLCNet은 두 가지 사람 검색 벤치마크(CUHK-SYSU 및 PRW)에서 실험을 수행하였으며, 더 도전적인 환경인 MovieNet에서의 캐릭터 검색(Character search)으로도 확장하였다. 광범위한 실험 결과는 제안한 GLCNet이 세 가지 데이터셋에서 모두 최신 기술 대비 일관된 성능 향상을 보임을 입증한다. 본 연구의 소스 코드, 사전 학습 모델 및 새로운 데이터셋은 공개되어 있으며, 다음 링크에서 확인할 수 있다: https://github.com/ZhengPeng7/GLCNet.