2ヶ月前

ARTrackV2: 自回帰トラッカーの注目場所と記述方法を指示するプロンプト

Yifan Bai; Zeyang Zhao; Yihong Gong; Xing Wei
ARTrackV2: 自回帰トラッカーの注目場所と記述方法を指示するプロンプト
要約

ARTrackV2の紹介を行います。このシステムは、追跡の2つの重要な側面を統合しています。すなわち、対象物体がどこにあるか(位置特定)と、ビデオフレーム間でどのように説明するか(外観解析)です。前バージョンであるARTrackの基礎を活用しつつ、ARTrackV2では統一的な生成フレームワークを導入し、自己回帰的手法により物体の軌道を「読み出し」、その外観を「再述」します。この手法は、運動と視覚特徴の同時進化を以前の推定値に基づいてモデル化する時間連続的な方法論を促進します。さらに、ARTrackV2は効率性と簡潔さに優れています。フレーム内での自己回帰という効率の悪い手法や、外観更新のために手動で調整されたパラメータを必要としない点が特徴です。その単純さにもかかわらず、ARTrackV2は主要なベンチマークデータセットにおいて最先端の性能を達成しており、特に効率性において著しい改善が見られます。具体的には、GOT-10kデータセットではAOスコア79.5%、TrackingNetデータセットではAUCスコア86.1%を達成し、ARTrackよりも3.6倍速い処理速度を実現しています。本研究で使用したコードは公開される予定です。

ARTrackV2: 自回帰トラッカーの注目場所と記述方法を指示するプロンプト | 最新論文 | HyperAI超神経