
비디오 시퀀스에서 다중 객체 추적 문제는 여러 가지 어려운 과제를 제기합니다. 검출을 통한 추적(tracking-by-detection)의 경우, 이러한 과제에는 객체 재식별(object re-identification), 운동 예측(motion prediction), 그리고 가림(occlusions) 처리가 포함됩니다. 본 연구에서는 이러한 특정 과제들을 직접적으로 목표로 하지 않고도 추적을 성공적으로 수행하는 트래커(tracker)를 소개합니다. 특히, 우리는 추적 데이터에 대한 특별한 학습(training)이나 최적화(optimization)를 수행하지 않습니다. 이를 위해, 객체 검출기(object detector)의 바운딩 박스 회귀(bounding box regression)를 활용하여 다음 프레임에서 객체의 위치를 예측함으로써, 검출기를 트랙터(Tracktor)로 변환합니다. 우리는 트랙터의 잠재력을 보여주고, 간단한 재식별(re-identification)과 카메라 운동 보정(camera motion compensation)을 추가하여 세 개의 다중 객체 추적 벤치마크에서 새로운 최신 수준(state-of-the-art)을 제공합니다. 또한, 현재까지 알려진 최신 추적 방법들과 우리의 트랙터를 비교하여 성능과 실패 사례에 대한 분석을 수행합니다. 놀랍게도, 복잡한 추적 시나리오, 즉 작은 객체와 가려진 객체 또는 누락된 검출(missing detections)을 처리하는 데 있어 전용 추적 방법들(dedicated tracking methods)이 크게 우수하지 않은 것으로 나타났습니다. 그러나 우리의 접근 방식은 대부분의 쉬운 추적 시나리오를 해결하는데 효과적이었습니다. 따라서, 우리는 이 접근 방식을 새로운 추적 패러다임으로 제시하며 앞으로의 연구 방향에 대해 유망한 점들을 지적합니다. 전체적으로 트랙터는 현재 어떤 추적 방법보다도 우수한 추적 성능을 제공하며, 우리의 분석은 여전히 해결되지 않은 추적 도전 과제들을 드러내어 향후 연구 방향을 고무시키는 역할을 합니다.