11일 전

DiffusionTrack: 시각적 객체 추적을 위한 포인트 세트 확산 모델

{Chao Ma, Zhongdao Wang, Fei Xie}
DiffusionTrack: 시각적 객체 추적을 위한 포인트 세트 확산 모델
초록

기존의 시암즈(Siamese) 또는 트랜스포머 기반 추적기는 일반적으로 시각적 객체 추적을 단일 forward 평가 방식을 사용하는 일회성 탐지 문제로 모델링한다. 즉, 한 번의 전방 계산 과정을 통해 대상 객체의 위치를 결정한다. 이러한 추적기들은 성공적인 성능을 보여주고 있지만, 단일 forward 평가 방식이 자가 보정(self-correction) 기능을 결여하고 있어, 유사한 외형을 가진 방해 요소(distractor)로 인해 쉽게 추적 오차가 발생할 수 있다. 이 문제를 해결하기 위해 본 연구에서는 시각 추적을 점 집합 기반의 노이즈 제거 확산 과정(noise-to-target denoising diffusion process)로 재정의하고, 새로운 생성 학습 기반 추적기인 DiffusionTrack을 제안한다. DiffusionTrack은 두 가지 매력적인 특성을 지닌다. 첫째, 프레임별로 동적으로 탐색하는 방식으로, 다수의 노이즈 제거 확산 단계를 활용하여 대상을 탐지하는 새로운 '노이즈에서 대상으로'의 추적 패러다임을 따르는 점이다. 둘째, 확산 과정을 점 집합(point set) 표현 방식으로 모델링함으로써, 외형의 변화에 더 잘 대응하고 보다 정밀한 위치 추정이 가능하다. 이 과정의 부가적 이점은 후처리 과정(예: 윈도우 페널티(window penalty) 방식 제거 등)이 크게 단순화된다는 점이다. 복잡한 기법 없이도 DiffusionTrack은 최신 기술 대비 뛰어난 성능을 달성하며 실시간으로 작동한다. 코드는 https://github.com/VISION-SJTU/DiffusionTrack 에 공개되어 있다.

DiffusionTrack: 시각적 객체 추적을 위한 포인트 세트 확산 모델 | 최신 연구 논문 | HyperAI초신경