11日前

TransMOT:複数対象追跡のための空間時系列グラフTransformer

Peng Chu, Jiang Wang, Quanzeng You, Haibin Ling, Zicheng Liu
TransMOT:複数対象追跡のための空間時系列グラフTransformer
要約

動画内の複数オブジェクトを追跡するには、オブジェクト間の空間時間的相互作用を正確にモデル化することが不可欠です。本論文では、強力なグラフ変換器(graph transformer)を活用し、オブジェクト間の空間的・時間的相互作用を効率的にモデル化する手法、TransMOTを提案します。TransMOTは、追跡対象の軌道をスパースな重み付きグラフの集合として表現し、その上で空間グラフ変換器エンコーダ層、時間変換器エンコーダ層、および空間グラフ変換器デコーダ層を構築することで、多数のオブジェクト間の相互作用を効果的に捉えます。このアプローチは、従来のTransformerよりも計算効率が高く、同時に追跡精度も向上しています。さらに、追跡速度と精度を向上させるために、低スコアの検出結果や長期的な遮蔽(occlusion)に対処するためのカスケードアソシエーションフレームワークを提案します。これらの困難な状況は従来の手法では計算コストが非常に高くなるため、TransMOTにおいても効率的な処理が求められます。提案手法はMOT15、MOT16、MOT17、MOT20を含む複数のベンチマークデータセット上で評価され、すべてのデータセットで最先端(SOTA)の性能を達成しました。

TransMOT:複数対象追跡のための空間時系列グラフTransformer | 最新論文 | HyperAI超神経