
이 연구는 팀 스포츠 방송 영상 내에서 선수 재식별(Re-identification) 문제에 초점을 맞추고 있다. 구체적으로, 경기 중 특정 순간에 다양한 카메라 시점에서 촬영된 이미지 내에서 동일한 선수를 식별하는 것을 목표로 한다. 이 작업은 기존의 사람 재식별(Person Re-ID) 기술과 몇 가지 중요한 측면에서 차이를 보인다. 첫째, 같은 팀의 선수들은 매우 유사한 복장을 착용하고 있어 서로를 구분하기 어렵다. 둘째, 각 선수의 정체성(identity)에 해당하는 샘플 수가 매우 적어, 재식별 시스템을 효과적으로 학습시키는 데 어려움이 있다. 셋째, 이미지의 해상도가 낮고, 상황에 따라 큰 차이를 보이며, 선수들의 빠른 움직임과 심각한 가림 현상이 복합적으로 작용하여 재식별의 어려움이 크게 증가한다.본 논문에서는 단순하지만 효과적인 계층적 데이터 샘플링 절차와 중심점 손실 함수(Centroid Loss Function)를 제안한다. 이 두 요소를 결합 사용함으로써, 네트워크 구조나 하이퍼파라미터를 변경하지 않고도 평균 정밀도(mAP)를 7~11.5점, 순위 1 정확도(Rank-1, R1)를 8.8~14.9점 향상시킬 수 있다. 제안하는 데이터 샘플링 전략은 학습 분포와 테스트 분포 간의 유사성을 높여, 임베딩(또는 특징 벡터)의 중심점 추정을 보다 정확하게 만들 수 있도록 도와준다. 놀랍게도, 본 연구는 제한된 데이터 환경(본 연구의 적용 사례와 동일한 상황)에서 유클리드 거리 기반의 단순한 중심점 손실 함수가 널리 사용되는 트리플릿-중심점 손실 함수보다 훨씬 우수한 성능을 보임을 확인했다. 이는 컨볼루션 네트워크뿐 아니라 비전 트랜스포머(Vision Transformer)를 포함한 다양한 아키텍처에서도 동일한 개선 효과를 입증하였다.본 연구의 접근법은 SoccerNet Re-Identification Challenge 2022의 공개 테스트 분할(Test-split)에서 mAP 86.0, R1 81.5로 상위 수준의 성능을 기록하며, 최고 성능을 보인 방법 중 하나로 평가받았다. 또한, 비공개 챌린지 분할(Sequestered Challenge Split)에서는 mAP 84.9, R1 80.1의 성과를 달성하였다. 스포츠 관련 재식별 연구는 여전히 매우 제한적이고, 본 연구는 이 분야에 대해 문헌상에서 가장 초기의 논의 중 하나로 기여하고 있다.