2ヶ月前

MOTRv2: 事前学習されたオブジェクト検出器によるエンドツーエンドの多目的追跡のブートストラッピング

Zhang, Yuang ; Wang, Tiancai ; Zhang, Xiangyu
MOTRv2: 事前学習されたオブジェクト検出器によるエンドツーエンドの多目的追跡のブートストラッピング
要約

本論文では、事前学習された物体検出器を用いてエンドツーエンドの多物体追跡をブートストラップする単純かつ効果的なパイプラインであるMOTRv2を提案します。既存のエンドツーエンド手法であるMOTRとTrackFormerは、主に検出性能が低いことから、検出ベースの追跡手法に劣っています。私たちはこの問題に対処するために、MOTRに優れた物体検出器を優雅に組み込むことを目指しています。まず、クエリのアンカー表現を採用し、次に追加の物体検出器を使用してプロポーザルを生成し、これらをアンカーとして使用することでMOTRに検出の事前情報を提供します。この単純な変更により、MOTRにおける検出と関連付けタスクの共同学習間の衝突が大幅に緩和されます。MOTRv2はクエリ伝播機能を維持しつつ、大規模ベンチマークでも良好なスケーラビリティを示します。MOTRv2は第1回グループダンス中の多人数追跡チャレンジで1位(DanceTrackでのHOTA 73.4%)となりました。さらに、BDD100Kデータセットにおいても最先端の性能を達成しています。私たちはこの単純かつ効果的なパイプラインが、エンドツーエンドの多物体追跡コミュニティにとって新しい洞察を与えることを期待しています。コードは\url{https://github.com/megvii-research/MOTRv2}から入手可能です。