15일 전

Deep Miner: 사람 재식별을 위한 풍부하고 다양한 특징을 채굴하는 깊이 있고 다중 분기 네트워크

Abdallah Benzine, Mohamed El Amine Seddik, Julien Desmarais
Deep Miner: 사람 재식별을 위한 풍부하고 다양한 특징을 채굴하는 깊이 있고 다중 분기 네트워크
초록

최근의 사람 재식별(Person Re-Identification) 기법은 대부분 심층 합성곱 신경망(Convolutional Neural Networks, CNNs)을 기반으로 하고 있다. 이러한 네트워크는 분류나 물체 탐지와 같은 다양한 작업에서 효과적인 성능을 발휘하지만, 객체의 가장 구분 가능한 부분에만 집중하는 경향이 있어, 객체의 모든 관련 특징을 효과적으로 추출하지는 못한다. 이는 재식별 작업에서 CNN의 성능을 저하시키는 요인이 된다. 왜냐하면 재식별은 다양한 세부 특징을 정확히 식별해야 하기 때문이다. 따라서 네트워크가 더 넓은 범위의 세부적인 특징을 학습할 수 있도록 하는 것이 중요하며, 이를 통해 사람의 재식별 과정이 더욱 효과적이고 세부적인 변화에 대해 강건해질 수 있다. 본 논문에서는 사람의 재식별을 위해 더 풍부하고 다양한 특징을 "채굴(Mine)"할 수 있도록 하는 Deep Miner 기법을 제안한다. Deep Miner는 세 가지 유형의 브랜치로 구성된다: 전역 브랜치(G-branch), 국소 브랜치(L-branch), 입력 제거 브랜치(IE-branch). G-branch는 초기 백본(Backbone)에 해당하며 전역적인 특징을 예측한다. L-branch는 부분 수준의 해상도 특징을 추출한다. 반면 IE-branch는 부분적으로 억제된 특징 맵을 입력으로 받아, G-branch가 무시한 새로운 특징을 출력으로 생성함으로써 네트워크가 새로운 특징을 "채굴"하도록 한다. 이 목적을 달성하기 위해, 특정 CNN 내에서 특징을 식별하고 제거하는 전용 억제 절차를 도입하였다. 이 억제 절차는 간단한 구조를 가지면서도, 기존 최상위(SOTA) 재식별 방법보다 현저히 뛰어난 성능을 보이는 모델을 생성하는 주요 장점을 지닌다. 구체적으로, 네 가지 표준 사람 재식별 벤치마크에서 실험을 수행한 결과, SOTA 기법 대비 최대 6.5%의 mAP 점수 향상을 관측하였다.

Deep Miner: 사람 재식별을 위한 풍부하고 다양한 특징을 채굴하는 깊이 있고 다중 분기 네트워크 | 최신 연구 논문 | HyperAI초신경