17일 전

FlipReID: 사람 재식별에서 학습과 추론 간의 격차 해소

Xingyang Ni, Esa Rahtu
FlipReID: 사람 재식별에서 학습과 추론 간의 격차 해소
초록

신경망은 데이터에 대한 수요가 크기 때문에, 훈련 과정에 데이터 증강(data augmentation)을 도입하는 것은 데이터셋을 확장하고 일반화 성능을 향상시키는 널리 사용되는 기법이다. 반면에, 여러 증강된 샘플의 예측 결과를 통합하는 방식(즉, 추론 시 증강, test-time augmentation)을 활용하면 성능을 더욱 높일 수 있다. 사람 재식별(person re-identification) 모델의 맥락에서, 원본 이미지와 수평 반전된 이미지의 임베딩을 각각 추출한 후, 최종 표현은 해당 특징 벡터들의 평균을 취하는 것이 일반적인 관행이다. 그러나 이러한 방식은 훈련과 추론 간의 불일치를 초래한다. 즉, 추론 시 계산되는 평균 특징 벡터는 훈련 프로세스에 포함되지 않는다. 본 연구에서는 이러한 문제를 해결하기 위해 플립 손실(flip loss)을 도입한 FlipReID 구조를 제안한다. 구체적으로, FlipReID 구조를 사용하는 모델은 원본 이미지와 반전 이미지 모두에서 동시에 훈련되며, 플립 손실을 도입함으로써 대응하는 이미지 쌍의 특징 벡터 간의 평균 제곱 오차를 최소화한다. 광범위한 실험 결과에 따르면, 제안한 방법이 일관된 성능 향상을 가져온다. 특히, 가장 큰 사람 재식별 데이터셋인 MSMT17에서 새로운 기록을 수립하였다. 소스 코드는 https://github.com/nixingyang/FlipReID 에 공개되어 있다.

FlipReID: 사람 재식별에서 학습과 추론 간의 격차 해소 | 최신 연구 논문 | HyperAI초신경