18일 전

인크리멘탈 생성형 가림막 적대적 억제 네트워크를 통한 사람 재식별

{Liang Wang, Jun Wu, Shanshan Zhang, Shuguang Dou, Xinbi Lv, Cairong Zhao}
인크리멘탈 생성형 가림막 적대적 억제 네트워크를 통한 사람 재식별
초록

사람 재식별(Person re-identification, re-id)은 이미지 내에 부분적 가림(occlusion)이 존재하면서 보행자에 대한 구분력 있는 정보가 부족한 상황에서 큰 도전에 직면해 있다. 그러나 일부 연구들은 인간의 자세 랜드마크, 마스크 맵, 공간 정보 등 은닉된 정보를 포착하기 위해 복잡한 모듈을 지속적으로 설계해왔다. 이러한 네트워크는 보행자 가림되지 않은 신체 영역에 대한 구분력 있는 특징 학습에 집중하며, 공간적 비일치 상황에서도 효과적인 매칭을 실현한다. 그러나 기존의 단일 기반 데이터 증강 기법은 성능 향상에 한계가 있어, 데이터 증강에 대한 연구는 여전히 소수에 그치고 있다. 이러한 가림 문제를 해결하기 위해, 본 연구는 새로운 증분형 생성적 가림 적대적 억제(Incremental Generative Occlusion Adversarial Suppression, IGOAS) 네트워크를 제안한다. 이 네트워크는 다음과 같은 두 가지 핵심 구성 요소로 이루어져 있다. 1) 증분형 생성적 가림 블록은 쉬운 가림부터 점진적으로 어려운 가림 데이터를 생성함으로써, 네트워크가 가장 어려운 가림을 직접 학습하는 대신 점진적으로 더 어려운 가림에 적응하도록 유도함으로써 가림에 대한 강건성을 향상시킨다. 2) 전역 적대적 억제(Global-Adversarial Suppression, G&A) 프레임워크는 전역 브랜치와 적대적 억제 브랜치로 구성된다. 전역 브랜치는 이미지의 안정적인 전역 특징을 추출하며, 적대적 억제 브랜치는 두 개의 가림 억제 모듈을 내장하고 있어 생성된 가림 영역에 대한 반응을 최소화하고, 가림되지 않은 신체 영역에 대한 주의 기반 특징 표현을 강화한다. 마지막으로, 두 브랜치의 특징을 연결함으로써 더 구분력 있는 보행자 특징 서술자(feature descriptor)를 얻을 수 있으며, 이는 가림 문제에 대해 강건하다. 제안한 IGOAS의 성능은 가림이 발생한 데이터셋에서 검증되었으며, Occluded-DukeMTMC 데이터셋에서 60.1%의 Rank-1 정확도와 49.4%의 mAP를 달성하여 경쟁적인 성능을 보였다.