HyperAIHyperAI

Command Palette

Search for a command to run...

MeMOTR:マルチオブジェクトトラッキングにおける長期記憶拡張型Transformer

Ruopeng Gao Limin Wang

概要

複数対象追跡(Multiple Object Tracking: MOT)は動画タスクとして、対象の時系列情報を効果的に捉えることが求められる。しかし、現存する大多数の手法は隣接フレーム間の対象特徴のみを明示的に活用しており、長期的な時系列情報をモデル化する能力に欠けている。本論文では、長期記憶を統合したTransformerモデルであるMeMOTRを提案する。本手法は、独自のメモリアテンション層を用いて長期記憶を注入することで、同一対象のトラック埋め込みをより安定的かつ区別しやすくする。これにより、モデルの対象関連付け能力が顕著に向上する。DanceTrackデータセットにおける実験結果から、MeMOTRは最先端手法に対してHOTAおよびAssAの各指標でそれぞれ7.9%および13.0%の優位性を示した。さらに、MOT17における関連付け性能においても他のTransformerベースの手法を上回り、BDD100Kにおいても良好な汎化性能を発揮した。コードはhttps://github.com/MCG-NJU/MeMOTRにて公開されている


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています