2달 전

개선된 주목도 및 의미 해석을 활용한 심층 신경망 모델 기반 사람 재식별

Rodolfo Quispe; Helio Pedrini
개선된 주목도 및 의미 해석을 활용한 심층 신경망 모델 기반 사람 재식별
초록

카메라에서 획득한 사람의 비디오나 이미지가 주어졌을 때, 사람 재식별(person re-identification)은 다른 카메라에서 촬영된 비디오나 이미지에서 동일한 사람의 모든 인스턴스를 검색하는 과정입니다. 이 작업은 감시, 법과학, 로봇공학, 멀티미디어 등 다양한 분야에서 응용될 수 있습니다. 본 논문에서는 두 가지 힌트인 주목도(saliency)와 의미 파싱(semantic parsing) 맵의 능력을 활용하여 보완적 표현을 학습해 기존 백본보다 성능을 개선하는 새로운 프레임워크인 주목도-의미 파싱 재식별(Saliency-Semantic Parsing Re-Identification, SSP-ReID)을 제안합니다. 여러 힌트를 융합하는 아이디어는 특정 시나리오에서 하나의 반응이 다른 것보다 더 우수할 수 있다는 점에 기반하며, 이를 결합하여 성능을 높이는 것이 유리합니다. 본 프레임워크는 정의상 다양한 네트워크에 쉽게 적용할 수 있으며, 다른 경쟁적인 방법들과 대조적으로 우리의 학습 과정은 간단하고 표준화된 프로토콜을 따릅니다. 우리는 5개의 백본과 3개의 벤치마크를 통해 제안된 접근법에 대한 광범위한 평가를 제시합니다. 실험 결과는 우리의 사람 재식별 프레임워크의 효과성을 입증하며, 또한 재순위 매기기(re-ranking) 기술과 결합하여 세 개의 벤치마크에서 최신 연구 결과(state-of-the-art results)를 달성하였습니다.