16日前

LMOT:混雑した環境における効率的な軽量型検出とトラッキング

{AbdElMoniem Bayoumi, Hoda Baraka, Rana Mostafa}
要約

多対象追跡は、ロボット工学およびコンピュータビジョンのさまざまな応用において不可欠な要素である。しかし、従来の多対象追跡技術は、追跡精度と計算実行時間のトレードオフを伴い、リアルタイム応用への導入に課題を抱えている。本論文では、リアルタイム性を実現する新しい軽量モデル、LMOT(Light-weight Multi-Object Tracker)を提案する。LMOTは、現在の画像から歩行者検出と追跡を統合的に実行する。本モデルは、計算効率の高い簡略化されたDLA-34エンコーダネットワークを採用し、現在の画像からの検出特徴量を抽出する。さらに、前フレーム画像および対応する検出ヒートマップに対して、線形変換器(linear transformer)を用いて効率的な追跡特徴量を生成する。その後、LMOTは検出特徴マップと追跡特徴マップを多層構造で融合し、カルマンフィルタを基にした二段階のオンラインデータ連携手法を用いてトラックレットを生成する。我々は、実世界の難易度の高いMOT16/17/20データセット上でモデルを評価した結果、LMOTは実行時間において最先端の追跡手法を大きく上回りつつ、高いロバスト性を維持していることが示された。LMOTは、最先端の追跡手法に比べて約10倍高速であり、性能精度において平均でわずか3.8%の差にとどまるため、はるかに計算負荷の低いモデルであることが明らかになった。

LMOT:混雑した環境における効率的な軽量型検出とトラッキング | 最新論文 | HyperAI超神経