2ヶ月前

一つのホモグラフィーが全て:IMMを基にしたホモグラフィーと複数オブジェクト状態推定の統合

Claasen, Paul Johannes ; de Villiers, Johan Pieter
一つのホモグラフィーが全て:IMMを基にしたホモグラフィーと複数オブジェクト状態推定の統合
要約

新しいオンラインMOT(Multi-Object Tracking)アルゴリズム、IMM Joint Homography State Estimation (IMM-JHSE) が提案されました。IMM-JHSEは、初期のホモグラフィ推定値を唯一の追加的な3D情報として使用します。これに対し、他の3D MOT手法では通常の3D測定値を使用しています。トラック状態ベクトルの一部としてホモグラフィ行列とその動態を共同モデリングすることで、IMM-JHSEは予測されたトラック位置状態に対するカメラ動作補償技術の明確な影響を取り除きます。これは従来のアプローチで一般的でした。さらに、静的および動的なカメラ動作モデルをIMM(Interacting Multiple Model)フィルタを使用して組み合わせています。単純なバウンディングボックス動作モデルが使用され、画像平面情報を組み込むためにバウンディングボックス位置を予測します。カメラ動作に対してIMMを適用するだけでなく、非標準的なIMMアプローチが採用されており、バウンディングボックスベースのBIoUスコアと地面平面上でのマハラノビス距離をIMM風に混合して関連付けのみを行います。これにより、地面平面から離れた動きに対する堅牢性が向上します。最後に、IMM-JHSEは動的なプロセスノイズと測定ノイズの推定技術を利用しています。DanceTrackおよびKITTI-carデータセットにおいて、UCMCTrack, OC-SORT, C-BIoU, ByteTrackなどの関連技術よりも優れており、それぞれHOTA(Higher Order Tracking Accuracy)スコアを2.64ポイントと2.11ポイント向上させています。また、MOT17, MOT20, KITTI-pedestrianデータセットでも競争力のある性能を提供しています。公開されている検出結果を使用した場合、IMM-JHSEは几乎所有の他の2D MOT手法を上回り、KITTI-carデータセットではオフラインである一部の3D MOT手法に次いで最良の性能を示しています。注目度に基づく追跡手法と比較すると、DanceTrackデータセットでは類似した性能を示し、MOT17データセットではそれらを超える性能を発揮しています。コードは公開されています: https://github.com/Paulkie99/imm-jhse.

一つのホモグラフィーが全て:IMMを基にしたホモグラフィーと複数オブジェクト状態推定の統合 | 最新論文 | HyperAI超神経