2ヶ月前
プロトタイプクロスアテンションネットワークを用いた複数物体追跡とセグメンテーション
Ke, Lei ; Li, Xia ; Danelljan, Martin ; Tai, Yu-Wing ; Tang, Chi-Keung ; Yu, Fisher

要約
複数物体追跡とセグメンテーションは、与えられたクラスに属する物体を検出、追跡、セグメンテーションすることを必要とします。多くの手法は、関連付け問題に対処するために時間次元のみを利用し、セグメンテーションマスク自体には単一フレームの予測に依存しています。本研究では、オンラインでの複数物体追跡とセグメンテーションのために豊富な時空間情報を活用できるプロトタイプクロスアテンションネットワーク(PCAN)を提案します。PCANはまず、時空間メモリを一連のプロトタイプに抽出し、次にクロスアテンションを使用して過去のフレームから豊富な情報を取得します。各物体のセグメンテーションには、PCANが対照的な前景および背景プロトタイプの一連を学習するプロトタイプ外観モジュールを採用し、これらのプロトタイプを時間的に伝播させます。広範な実験により、PCANがYouTube-VISおよびBDD100Kデータセットにおいて現在のビデオインスタンストラッキングおよびセグメンテーション競争の勝者を超えることが示されており、一段階および二段階のセグメンテーションフレームワークに対して効果的であることが確認されています。コードおよびビデオリソースは http://vis.xyz/pub/pcan で利用可能です。