11일 전

정확한 추적을 위한 타깃 전환 회귀

Yutao Cui, Cheng Jiang, Limin Wang, Gangshan Wu
정확한 추적을 위한 타깃 전환 회귀
초록

정확한 추적은 영상 내 대상의 외형 변화, 자세 및 시점 변화, 기하학적 변형 등으로 인해 여전히 도전적인 과제로 남아 있다. 최근의 앵커 기반 추적기들은 효율적인 회귀 메커니즘을 제공하지만, 정밀한 경계 상자(바운딩 박스) 추정을 수행하지 못하는 한계를 지닌다. 이러한 문제를 해결하기 위해 본 논문은 앵커 기반 추적에서 정확한 회귀를 가능하게 하기 위해, 트랜스포머 유사 구조의 회귀 브랜치를 재사용한 Target Transformed Regression(TREG)을 제안한다. TREG의 핵심은 대상 템플릿과 검색 영역 내 요소 간의 쌍별 관계를 모델링하고, 이를 통해 강화된 대상 시각적 표현을 생성하여 정밀한 경계 상자 회귀를 수행하는 데 있다. 이러한 대상 중심화된 표현은 대상과 관련된 정보를 강화함으로써 상자 경계의 정확한 위치를 결정하는 데 기여하며, 국소적이고 밀집된 매칭 메커니즘 덕분에 대상의 변형에 어느 정도 대응할 수 있다. 또한, 시간에 따른 대상의 외형 변화와 기하학적 변형에 대한 강건성을 높이기 위해 신뢰할 수 있는 템플릿을 선택하는 간단한 온라인 템플릿 업데이트 메커니즘을 제안하였다. VOT2018, VOT2019, OTB100, GOT10k, NFS, UAV123, LaSOT, TrackingNet 등 다양한 시각 추적 벤치마크에서의 실험 결과, TREG은 최신 기술 수준(SOTA)의 성능을 달성하였으며, LaSOT에서 성공률(Success Rate) 0.640을 기록하면서 약 30 FPS로 실시간 실행이 가능하다. 코드와 모델은 https://github.com/MCG-NJU/TREG 에 공개될 예정이다.

정확한 추적을 위한 타깃 전환 회귀 | 최신 연구 논문 | HyperAI초신경