Alpha-Refine: 정밀한 경계 상자 추정을 통한 추적 성능 향상

시각적 객체 추적은 주어진 대상에 대해 경계 박스를 정밀하게 추정하는 것을 목표로 하며, 왜곡 및 가림 등의 요인으로 인해 매우 도전적인 문제이다. 최근 많은 추적기들은 경계 박스 추정의 품질을 향상시키기 위해 다단계 추적 전략을 채택하고 있다. 이러한 방법들은 먼저 대상의 위치를 대략적으로 추정한 후, 이후 단계에서 초기 예측을 보정하는 방식으로 작동한다. 그러나 기존 접근 방식은 여전히 정밀도가 제한적이며, 각 단계 간의 강한 결합으로 인해 모델의 전이 가능성(transferability)이 크게 제약된다. 본 연구는 기존 추적기의 경계 박스 추정 품질을 크게 향상시킬 수 있는 새로운 유연하고 정확한 보정 모듈인 Alpha-Refine(AR)을 제안한다. 다양한 설계 옵션을 탐색한 결과, 성공적인 보정의 핵심은 가능한 한 상세한 공간 정보를 추출하고 유지하는 것임을 확인하였다. 이 원칙에 따라 Alpha-Refine는 픽셀 단위 상관관계(pixel-wise correlation), 코너 예측 헤드(corner prediction head), 보조 마스크 헤드(auxiliary mask head)를 핵심 구성 요소로 채택하였다. TrackingNet, LaSOT, GOT-10K, VOT2020 등 다양한 벤치마크에서 여러 기반 추적기들을 대상으로 한 종합적인 실험 결과, 제안한 방법은 거의 추가 지연(latency) 없이 기반 추적기의 성능을 크게 향상시킴을 입증하였다. Alpha-Refine를 적용한 강화된 추적기들 중에서는 ARSiamRPN(AR 강화된 SiamRPNpp)과 ARDiMP50(AR 강화된 DiMP50)이 효율-정밀도 균형에서 우수한 성능을 보였으며, ARDiMPsuper(AR 강화된 DiMP-super)는 실시간 속도에서 매우 경쟁력 있는 성능을 달성하였다. 코드 및 사전 학습된 모델은 https://github.com/MasterBin-IIAU/AlphaRefine 에서 제공된다.