하나의 호모그래피만으로 충분하다: IMM 기반 공동 호모그래피 및 다중 객체 상태 추정

새로운 온라인 다중 객체 추적(MOT) 알고리즘인 IMM Joint Homography State Estimation (IMM-JHSE)가 제안되었습니다. IMM-JHSE는 초기 호모그래피 추정치를 유일한 추가적인 3D 정보로 사용하는 반면, 다른 3D MOT 방법들은 일반적인 3D 측정값을 사용합니다. 트랙 상태 벡터의 일부로서 호모그래피 행렬과 그 동역학을 공동 모델링함으로써, IMM-JHSE는 이전 접근 방식에서 흔히 나타났던 카메라 운동 보상 기술이 예측된 트랙 위치 상태에 미치는 명시적인 영향을 제거합니다. 이를 확장하여, 정적 및 동적 카메라 운동 모델은 IMM 필터를 사용하여 결합됩니다. 간단한 바운딩 박스 운동 모델은 이미지 평면 정보를 통합하기 위해 바운딩 박스 위치를 예측하는 데 사용됩니다. 또한 카메라 운동에 IMM을 적용하는 것 외에도, 바운딩 박스 기반 BIoU 점수와 지면 평면 기반 마할라노비스 거리를 IMM 방식으로 혼합하여 연결만 수행하도록 하는 비표준 IMM 접근 방식이 적용되어, IMM-JHSE는 지면 평면에서 멀어지는 운동에 대해 견고성을 갖춥니다. 마지막으로, IMM-JHSE는 동적 프로세스 및 측정 노이즈 추정 기술을 활용합니다.IMM-JHSE는 DanceTrack 및 KITTI-차량 데이터셋에서 UCMCTrack, OC-SORT, C-BIoU 및 ByteTrack 등 관련 기술들을 개선하여 HOTA를 각각 2.64와 2.11만큼 증가시키며, MOT17, MOT20 및 KITTI-보행자 데이터셋에서도 경쟁력 있는 성능을 제공합니다. 공개적으로 이용 가능한 검출 결과를 사용할 때, IMM-JHSE는 KITTI-차량 데이터셋에서 거의 모든 다른 2D MOT 방법들을 능가하며, 오프라인 방법을 포함한 일부 3D MOT 방법들에만 뒤처집니다. 주의력을 활용한 추적 방법들과 비교했을 때, IMM-JHSE는 DanceTrack 데이터셋에서 유사한 성능을 보여주며, MOT17 데이터셋에서는 이들을 능가합니다. 코드는 공개되어 있습니다: https://github.com/Paulkie99/imm-jhse.