ATOM: 중첩 최대화를 통한 정확한 추적

최근 몇 년 동안 시각 추적의 견고성에 있어 놀라운 개선이 이루어졌지만, 추적 정확도의 향상은 제한적이었습니다. 강력한 분류기 개발에 초점이 맞춰져 있는 반면, 목표물 상태를 정확히 추정하는 문제는 크게 간과되어 왔습니다. 실제로 대부분의 추적 알고리즘은 목표물 바운딩 박스를 추정하기 위해 단순한 다중 스케일 검색을 사용합니다. 우리는 이 접근 방식이 근본적으로 한계가 있다고 주장합니다. 목표물 추정은 객체에 대한 고차원적인 지식을 필요로 하는 복잡한 작업이기 때문입니다.이 문제를 해결하기 위해, 우리는 전용된 목표물 추정 및 분류 구성 요소로 이루어진 새로운 추적 아키텍처를 제안합니다. 고차원적인 지식은 광범위한 오프라인 학습을 통해 목표물 추정에 통합됩니다. 우리의 목표물 추정 구성 요소는 목표물과 예측된 바운딩 박스 사이의 중첩을 예측하도록 훈련됩니다. 목표물 특유의 정보를 신중하게 통합함으로써, 우리의 접근 방식은 이전에 보지 못했던 바운딩 박스 정확도를 달성합니다. 또한, 우리는 온라인으로 훈련되는 분류 구성 요소를 도입하여 방해 물체가 존재할 때에도 높은 구분 능력을 보장합니다. 우리의 최종 추적 프레임워크는 다섯 가지 어려운 벤치마크에서 새로운 최고 수준을 설정하였습니다. 새로운 대규모 TrackingNet 데이터셋에서, 우리의 트래커 ATOM은 이전 최고 접근 방식보다 상대적으로 15%의 성능 향상을 보였으며, 30 FPS 이상으로 실행됩니다. 코드와 모델은 https://github.com/visionml/pytracking 에서 제공됩니다.