
사람 검색(Person search)은 현실적이고 자르지 않은 이미지에서 쿼리 사람을 동시에 탐지하고 식별하는 것을 목표로 한다. 이 목표를 달성하기 위해 최신 모델들은 Faster R-CNN과 같은 이단계 탐지기 위에 재식별(re-id) 분기(branch)를 추가하는 방식을 일반적으로 사용한다. ROI-Align 연산 덕분에 이 파이프라인은 각 객체 영역과 정확히 일치하는 re-id 특징을 생성함으로써 뛰어난 정확도를 달성하지만, 밀집된 객체 앵커(dense object anchors)로 인해 높은 계산 부하가 발생한다는 단점이 있다. 본 연구에서는 이러한 도전적인 과제를 효율적으로 해결하기 위해 앵커 기반(free) 접근법을 제안하며, 다음과 같은 전용 설계를 도입한다. 첫째, 프레임워크의 원형으로 앵커 기반 탐지기(예: FCOS)를 채택한다. 밀집된 객체 앵커가 없기 때문에 기존 사람 검색 모델보다 훨씬 높은 효율성을 보인다. 둘째, 이 앵커 기반 탐지기를 사람 검색에 직접 적용할 경우, 강력한 re-id 특징을 학습하는 데 여러 주요 과제가 존재하며, 이를 스케일, 영역, 작업 수준에서의 불일치(misalignment) 문제로 요약할 수 있다. 이러한 문제를 해결하기 위해, 더 구분력 있고 강건한 특징 임베딩을 생성할 수 있는 정렬된 특징 집합 모듈(aligned feature aggregation module)을 제안한다. 이를 바탕으로 본 모델을 특징 정렬형 사람 검색 네트워크(Feature-Aligned Person Search Network, AlignPS)라 명명한다. 셋째, 앵커 기반 및 앵커 기반 모델의 장점을 분석한 결과, AlignPS에 ROI-Align 헤드를 추가하여 re-id 특징의 강건성을 크게 향상시키면서도 모델의 높은 효율성을 유지할 수 있었다. CUHK-SYSU 및 PRW와 같은 두 가지 도전적인 벤치마크에서 실시한 광범위한 실험 결과, 본 프레임워크는 최고 수준 또는 경쟁 가능한 성능을 달성하면서도 더 높은 효율성을 보였다. 모든 소스 코드, 데이터 및 학습된 모델은 다음 주소에서 제공된다: https://github.com/daodaofr/alignps.