2달 전

ARTrackV2: Autoregressive Tracker의 주목 위치와 설명 방법 안내

Yifan Bai; Zeyang Zhao; Yihong Gong; Xing Wei
ARTrackV2: Autoregressive Tracker의 주목 위치와 설명 방법 안내
초록

우리는 ARTrackV2를 소개합니다. 이 시스템은 추적의 두 가지 핵심 요소인 대상 물체가 어디에 있는지를 결정하는(위치 결정)과 비디오 프레임 간에 어떻게 설명하는(외관 분석)을 통합합니다. 전작의 기반 위에서 ARTrackV2는 객체의 궤적을 '읽어내고' 객체의 외관을 '다시 말해주는' 자기회귀 방식으로 통합된 생성 프레임워크를 도입하여 개념을 확장합니다. 이러한 접근법은 이전 추정치에 의해 안내되는 동작과 시각적 특징의 공동 진화를 모델링하는 시간 연속적인 방법론을 촉진합니다. 또한, ARTrackV2는 효율성과 단순성을 갖추고 있어, 프레임 내 자기회귀와 외관 업데이트를 위한 수동 조정 파라미터 등 덜 효율적인 요소들을 제거하였습니다. 단순함에도 불구하고, ARTrackV2는 주요 벤치마크 데이터셋에서 최고 수준의 성능을 달성하며 뛰어난 효율성 향상을 보여주었습니다. 특히, ARTrackV2는 GOT-10k에서 AO 점수 79.5%와 TrackingNet에서 AUC 점수 86.1%를 기록하며 ARTrack보다 3.6배 더 빠른 속도를 나타냈습니다. 코드는 공개될 예정입니다.

ARTrackV2: Autoregressive Tracker의 주목 위치와 설명 방법 안내 | 최신 연구 논문 | HyperAI초신경