11日前

SportsMOT:複数のスポーツシーンにおける大規模なマルチオブジェクトトラッキングデータセット

Yutao Cui, Chenkai Zeng, Xiaoyu Zhao, Yichun Yang, Gangshan Wu, Limin Wang
SportsMOT:複数のスポーツシーンにおける大規模なマルチオブジェクトトラッキングデータセット
要約

スポーツシーンにおける多対象追跡(Multi-object tracking: MOT)は、選手の統計データを収集し、自動戦術分析を含むさらなる分析を支援する上で重要な役割を果たしています。しかし、現在のMOTベンチマークはこの分野にほとんど注目を寄せていなく、その発展を制限しています。本研究では、多様なスポーツシーンを対象とした大規模な多対象追跡データセット「SportsMOT」を提案します。このデータセットでは、コート上のすべての選手を追跡することを想定しています。SportsMOTは、バスケットボール、バレーボール、サッカーの3つのスポーツカテゴリから収集されたデータを含み、合計240の動画シーケンス、15万枚以上のフレーム(MOT17の約15倍)、160万以上のバウンディングボックス(MOT17の約3倍)を含んでいます。本データセットの特徴は以下の2点にあります:1)高速かつ変動する速度での運動、2)類似したが識別可能な外見(アピアランス)。これらの特性により、SportsMOTは運動に基づく関連付けと外見に基づく関連付けの両面で、MOTトラッカーの性能向上を促進することを期待しています。我々は複数の最先端トラッカーをベンチマーク化し、SportsMOTの主な課題が対象の関連付けにあることを明らかにしました。この課題を軽減するために、従来の「検出に基づく追跡(tracking-by-detection)」アーキテクチャに補助的な関連付けモデルとして、MixFormerに類似した構造を導入した新しいMOTフレームワーク「MixSort」を提案します。カスタマイズされた外見ベースの関連付けと元の運動ベースの関連付けを統合することで、MixSortはSportsMOTおよびMOT17の両方で最先端の性能を達成しました。さらに、MixSortを基盤としてSportsMOTの詳細な分析を行い、深い知見を提供しています。本データセットおよびコードは、https://deeperaction.github.io/datasets/sportsmot.html にて公開予定です。

SportsMOT:複数のスポーツシーンにおける大規模なマルチオブジェクトトラッキングデータセット | 最新論文 | HyperAI超神経