2달 전

SVDNet을 이용한 보행자 검색

Yifan Sun; Liang Zheng; Weijian Deng; Shengjin Wang
SVDNet을 이용한 보행자 검색
초록

본 논문은 검색 문제에 초점을 맞추어 사람 재식별(re-ID)의 응용을 목표로 SVDNet을 제안합니다. 우리는 컨벌루션 신경망(CNN)의 완전 연결(FC) 레이어 내부의 각 가중치 벡터를 투영 기저로 간주합니다. 관찰 결과, 이러한 가중치 벡터들은 일반적으로 매우 높은 상관관계를 가지고 있음을 알 수 있습니다. 이 문제는 FC 디스크립터의 항목들 사이에서도 상관관계가 발생하여 유클리드 거리를 기반으로 하는 검색 성능을 저하시킵니다. 이를 해결하기 위해 본 논문에서는 특이벡터 분해(Singular Vector Decomposition, SVD)를 활용하여 깊은 표현 학습 과정을 최적화하는 방법을 제안합니다. 구체적으로, 제약과 완화 반복(Restraint and Relaxation Iteration, RRI) 훈련 방식을 통해 CNN 훈련 과정에서 직교 제약 조건을 반복적으로 통합할 수 있으며, 이를 통해 SVDNet이 생성됩니다. 우리는 Market-1501, CUHK03, 그리고 Duke 데이터셋에서 실험을 수행하였으며, RRI가 투영 벡터들 사이의 상관관계를 효과적으로 줄이고 더 구분력 있는 FC 디스크립터를 생성하며, 재식별 정확도를大幅提高的事实进行了展示。例如,在Market-1501数据集中,CaffeNet的rank-1准确率从55.3%提高到80.5%,ResNet-50的rank-1准确率从73.8%提高到82.3%。(注:最后两句中的“大幅提高”和“例如”在韩文中分别对应“대폭 개선”和“예를 들어”,以确保译文流畅性和准确性。)为了确保完全符合要求,以下是修正后的翻译:우리는 Market-1501, CUHK03, 그리고 Duke 데이터셋에서 실험을 수행하였으며, RRI가 투영 벡터들 사이의 상관관계를 효과적으로 줄이고 더 구분력 있는 FC 디스크립터를 생성하며, 재식별 정확도를 대폭 개선함을 보여주었습니다. 예를 들어, Market-1501 데이터셋에서 CaffeNet의 rank-1 정확도는 55.3%에서 80.5%로 개선되었으며, ResNet-50의 rank-1 정확도는 73.8%에서 82.3%로 개선되었습니다.