11일 전

일반화 가능한 옴니-스케일 표현 학습을 통한 사람 재식별

Kaiyang Zhou, Yongxin Yang, Andrea Cavallaro, Tao Xiang
일반화 가능한 옴니-스케일 표현 학습을 통한 사람 재식별
초록

효과적인 사람 재식별(re-ID) 모델은 유사한 외모를 가진 사람들을 구분할 수 있도록 구분력이 뛰어나야 하며, 적응 없이 다양한 데이터셋에 배포될 수 있도록 일반화 능력도 가져야 한다. 본 논문에서는 이러한 두 가지 도전 과제를 해결하기 위해 새로운 CNN 아키텍처를 개발한다. 먼저, 다양한 공간적 스케일을 포착할 뿐만 아니라 다중 스케일의 상호보완적인 조합을 포함하는 ‘오미-스케일 특징(omni-scale features)’을 학습할 수 있는 재식별 CNN인 오미-스케일 네트워크(OSNet)를 제안한다. OSNet의 기본 구성 요소는 각각 특정 스케일에서 특징을 탐지하는 다수의 컨볼루션 스트림으로 구성되며, 오미-스케일 특징 학습을 위해 채널별 가중치를 가진 동적 다중 스케일 특징 융합을 수행하는 통합 집합 게이트(unified aggregation gate)를 도입한다. OSNet는 구성 요소가 인수분해된 컨볼루션( factorised convolutions)으로 구성되어 가볍다. 두 번째로, 일반화된 특징 학습을 향상시키기 위해 OSNet에 인스턴스 정규화(IN, instance normalisation) 레이어를 도입하여 데이터셋 간의 차이를 완화한다. 또한 이러한 IN 레이어의 최적 배치를 결정하기 위해 효율적인 미분 가능 아키텍처 탐색 알고리즘을 제안한다. 광범위한 실험 결과에 따르면, 전통적인 동일 데이터셋 설정에서 OSNet는 기존의 재식별 모델보다 훨씬 작음에도 불구하고 최상의 성능을 달성한다. 더 도전적이나 현실성 있는 크로스-데이터셋 설정에서는 타겟 데이터를 전혀 사용하지 않음에도 불구하고, 최근의 대부분의 비지도 도메인 적응 방법을 능가한다. 본 연구의 코드와 모델은 \texttt{https://github.com/KaiyangZhou/deep-person-reid}에서 공개된다.

일반화 가능한 옴니-스케일 표현 학습을 통한 사람 재식별 | 최신 연구 논문 | HyperAI초신경