
要約
グラフは、検出に基づく追跡(tracking-by-detection)枠組みの中で複数対象追跡(Multiple Object Tracking: MOT)を自然に定式化する手法を提供する。しかし、こうした構造化されたドメイン上で動作するモデルを定義することは非自明であり、学習手法にとって大きな課題をもたらす。その結果、多くの学習ベースの研究は、MOT用により優れた特徴量を学習することに注力し、それらを確立された最適化フレームワークと組み合わせるというアプローチを採用している。本研究では、MOTの古典的なネットワークフロー定式化を活用し、メッセージパッシングネットワーク(Message Passing Networks: MPNs)に基づく完全微分可能なフレームワークを提案する。本手法はグラフ領域上で直接操作を行うため、全検出結果に対してグローバルな推論が可能となり、最終的な解を予測できる。これにより、MOTにおける学習が特徴抽出に限定される必要はなく、データアソシエーションの段階にも適用可能であることを示した。また、3つの公開ベンチマークにおいて、MOTAおよびIDF1の両指標で顕著な性能向上を達成した。本研究のコードは、https://bit.ly/motsolv で公開されている。