
최근 연구에 따르면, 명시적인 깊은 특성 일치와 대규모 및 다양한 훈련 데이터가 사람 재식별(person re-identification)의 일반화를 크게 개선할 수 있음을 보여주고 있습니다. 그러나 대규모 데이터에서 깊은 매처러를 학습하는 효율성에 대해서는 아직 충분히 연구되지 않았습니다. 분류 매개변수 또는 클래스 메모리를 사용하여 학습하는 방법이 인기 있지만, 이는 큰 메모리와 계산 비용을 초래합니다. 반면에 미니 배치 내에서 쌍으로 깊은 메트릭 학습을 하는 것이 더 나은 선택일 것입니다. 그러나 가장 많이 사용되는 무작위 샘플링 방법인 잘 알려진 PK 샘플러는 깊은 메트릭 학습에 정보적이고 효율적이지 않습니다. 온라인 하드 예제 추출(hard example mining)이 학습 효율성을 어느 정도 개선했지만, 무작위 샘플링 후 미니 배치에서의 추출은 여전히 제한적입니다. 이를 통해 우리는 데이터 샘플링 단계에서 하드 예제 추출을 더 일찍 활용하는 방안을 탐구하게 되었습니다.본 논문에서는 대규모 깊은 메트릭 학습을 위한 효율적인 미니 배치 샘플링 방법인 그래프 샘플링(graph sampling, GS)을 제안합니다. 기본 아이디어는 각 에폭(epoch)의 시작 시 모든 클래스에 대해 최근접 이웃 관계 그래프를 구축하는 것입니다. 그런 다음, 각 미니 배치는 무작위로 선택된 클래스와 그 최근접 이웃 클래스들로 구성되어 정보적이고 도전적인 예제를 학습에 제공합니다. 적응된 경쟁 기준과 함께, 우리는 RandPerson 데이터셋에서 훈련했을 때 MSMT17의 Rank-1 정확도에서 25.1% 개선되도록 일반화 가능한 사람 재식별 분야의 최신 기술(state of the art)을 크게 발전시켰습니다. 또한 제안된 방법은 MSMT17 데이터셋에서 훈련했을 때 CUHK03-NP의 Rank-1 정확도에서도 경쟁 기준보다 6.8% 높은 성능을 보였습니다. 한편, RandPerson 데이터셋(8,000명의 식별자 포함)에서 훈련할 때 훈련 시간이大幅减少,从25.4小时减少到2小时。코드는 https://github.com/ShengcaiLiao/QAConv 에서 확인할 수 있습니다.(注:在最后一句中,“大幅减少”被误翻译为“大幅减少”,正确的翻译应该是“대폭 감소했습니다”。以下是修正后的版本:)한편, RandPerson 데이터셋(8,000명의 식별자 포함)에서 훈련할 때 훈련 시간이 대폭 감소했습니다, 25.4시간에서 2시간으로.코드는 https://github.com/ShengcaiLiao/QAConv 에서 확인할 수 있습니다.