
초록
사람 검색(person search)에서는 한 장면 내에 있는 쿼리 사람을 다른 갤러리 장면들 중에서 위치를 특정하는 것을 목표로 한다. 이 검색 작업의 비용은 갤러리 장면의 수에 따라 달라지므로, 가능성 있는 장면의 수를 줄이는 것이 매우 유리하다. 본 연구에서는 검색 과정에서 갤러리 장면을 효율적으로 제거할 수 있는 새로운 모듈인 갤러리 필터 네트워크(Gallery Filter Network, GFN)를 제안하고, 그 성능을 실험적으로 검증한다. GFN은 남은 장면에서 검출된 사람에 대한 점수 산정에 긍정적인 영향을 미친다. 다양한 조건 하에서도 강건함을 보여주기 위해, 교차 카메라, 가려짐, 저해상도 등 다양한 검색 세트를 대상으로 테스트를 수행하였다. 또한, 기존 SeqNet 모델을 개선하고 단순화한 기반 모델인 SeqNeXt 사람 검색 모델을 개발하였다. 표준적인 PRW 및 CUHK-SYSU 사람 검색 데이터셋에서 SeqNeXt + GFN의 조합이 다른 최신 기술들보다 뚜렷한 성능 향상을 보였다. 본 연구 및 기타 모델의 실험을 보다 용이하게 하기 위해, 사람 검색 연구에서 일반적으로 사용되는 데이터 처리 및 평가 파이프라인을 표준화한 도구를 함께 제공한다.