16일 전
RPT: 시아모닉 시각 추적을 위한 포인트 세트 표현 학습
Ziang Ma, Linyuan Wang, Haitao Zhang, Wei Lu, Jun Yin

초록
강건한 시각 추적 분야에서 상당한 진전이 이루어졌지만, 정확한 타겟 상태 추정은 여전히 매우 도전적인 문제로 남아 있다. 본 논문에서는 이 문제의 근본 원인이 일반적으로 사용되는 경계 상자(Bounding Box) 표현 방식과 밀접한 관련이 있다고 주장한다. 경계 상자는 객체의 공간적 범위를 대략적으로만 제공하기 때문이다. 따라서 타겟 상태를 보다 정밀하게 추정하기 위해, 대상 영역의 의미적이고 기하학적으로 중요한 위치를 나타내는 대표 점들의 집합을 사용하는 보다 세밀한 표현 방식을 제안한다. 이 점 집합은 객체의 외형을 더 정교하게 국소화하고 모델링할 수 있도록 학습된다. 또한 계층적인 합성곱 층을 융합함으로써 세부 구조 정보를 얻기 위한 다중 수준 집약 전략을 추가로 제안한다. OTB2015, VOT2018, VOT2019, GOT-10k 등 여러 도전적인 벤치마크에서 실시한 광범위한 실험 결과, 본 방법은 20 FPS 이상의 실시간 속도를 유지하면서도 새로운 최고 성능(SOTA)을 달성함을 입증하였다.