상대적 거리 비교를 이용한 심층 특성 학습을 통한 사람 재식별

다른 장면에서 동일한 개인을 식별하는 것은 지능형 비디오 감시 시스템에서 중요한 과제이지만 어려운 문제입니다. 이 문제의 주요 난점은 같은 사람의 유사성을 큰 외관과 구조적 변화에 대해 유지하면서 다른 개인들을 구분하는 방법에 있습니다. 본 논문에서는 딥 뉴럴 네트워크를 기반으로 한 스케일러블 거리 주도 특성 학습 프레임워크를 제시하여 이러한 기존 도전 과제를 해결할 수 있는 효과성을 입증합니다. 구체적으로, 클래스 레이블(개인 ID)이 부여된 훈련 이미지가 주어질 때, 먼저 각각 세 개의 이미지를 포함하는 많은 트리플렛 단위를 생성합니다. 즉, 매칭된 참조 이미지와 매칭되지 않은 참조 이미지를 가진 한 사람을 나타냅니다. 이러한 단위들을 입력으로 처리하여 컨볼루션 신경망을 구축하여 계층적 표현을 생성하고, 그 다음 $L2$ 거리 측정법을 적용합니다. 파라미터 최적화를 통해 우리의 프레임워크는 각 트리플렛 단위에 대해 매칭된 쌍과 매칭되지 않은 쌍 간의 상대적인 거리를 최대화하도록 설계되었습니다. 또한, 프레임워크에서 발생하는 복잡한 문제 중 하나는 트리플렛 구성이 훈련 트리플렛의 수를 세제곱적으로 증가시키는 것입니다. 하나의 이미지는 여러 트리플렛 단위에 참여할 수 있기 때문입니다. 이 문제를 극복하기 위해, 우리는 효과적인 트리플렛 생성 방안과 최적화된 경사 하강 알고리즘을 개발하여 계산 부하가 주로 원본 이미지의 수에 의존하도록 만들었습니다. 몇 가지 도전적인 데이터베이스에서 우리의 접근법은 매우 유망한 결과를 달성하며 다른 최신 접근법들보다 우수한 성능을 보였습니다.