칼만 필터를 넘어서는: 개선된 객체 추적을 위한 딥러닝 기반 필터

전통적인 탐지 기반 추적 시스템은 일반적으로 상태 추정에 칼만 필터(Kalman Filter, KF)를 활용한다. 그러나 KF는 도메인 특화된 설계 선택이 필요하며, 비선형 운동 패턴을 처리하는 데 부적합하다. 이러한 한계를 해결하기 위해 우리는 두 가지 혁신적인 데이터 기반 필터링 방법을 제안한다. 첫 번째 방법은 학습 가능한 운동 모델을 갖춘 베이지안 필터를 사용하여 객체의 미래 위치를 예측하고, 객체 탐지기로부터 얻은 관측값과 결합함으로써 경계상자 예측 정확도를 향상시킨다. 또한 이 방법은 KF에 특징적인 대부분의 도메인 특화 설계 선택을 제거한다. 두 번째 방법은 엔드투엔드 학습 가능한 필터로, 탐지기의 오류를 자동으로 보정하는 능력을 학습함으로써 도메인 전문 지식의 필요성을 더욱 줄인다. 더불어, 제안된 필터링 방법과 결합할 수 있는 다양한 운동 모델 아키텍처를 제안한다. 이들 아키텍처는 순환 신경망(RNN), 신경미분방정식(Neural Ordinary Differential Equations), 조건부 신경과정(Conditional Neural Processes)을 기반으로 한다. 여러 데이터셋에 걸친 광범위한 평가 결과, 특히 비선형 운동 패턴에 대해 우리의 필터가 전통적인 KF보다 우수함을 입증하였다. 이는 우리 필터가 가장 적합한 사용 사례이기도 하다. 또한, 노이즈에 대한 강건성 분석을 수행한 결과, 긍정적인 성능을 보였다. 더불어, 추적 경로와 관측값을 연결하는 데 사용할 새로운 비용 함수를 제안한다. 이 새로운 연결 비용 함수를 제안된 필터와 결합한 추적기의 경우, 움직임이 풍부한 DanceTrack 및 SportsMOT 데이터셋에서 다수의 평가 지표에 따라 기존의 SORT 방법 및 기타 운동 기반 추적기보다 우수한 성능을 나타냈다.