2ヶ月前
ビデオオブジェクトセグメンテーションにおけるオブジェクトの再導入
Ho Kei Cheng; Seoung Wug Oh; Brian Price; Joon-Young Lee; Alexander Schwing

要約
Cutieを紹介します。これはオブジェクトレベルのメモリ読み込み機能を持つビデオオブジェクトセグメンテーション(VOS)ネットワークで、メモリからオブジェクト表現を取り出してビデオオブジェクトセグメンテーション結果に反映させます。最近のVOSに関する研究では、ボトムアップのピクセルレベルのメモリ読み込みが採用されていますが、特にディストラクターが存在する場合にマッチングノイズにより性能が低下することがあります。これに対して、Cutieはトップダウンのオブジェクトレベルのメモリ読み込みを実現するために、一連のオブジェクトクエリを適応させます。これらのクエリを通じて、Cutieはボトムアップのピクセル特徴量と反復的に対話し、クエリベースのオブジェクトトランスフォーマー(qt, したがってCutieと呼ばれます)を使用します。オブジェクトクエリはターゲットオブジェクトの高レベルな要約として機能し、一方で高解像度の特徴マップは正確なセグメンテーションのために保持されます。さらに、前景-背景マスクアテンションによって、前景オブジェクトと背景の意味論的な区別を明確にします。困難なMOSEデータセットにおいて、CutieはXMemと同程度の実行時間で8.7 J&F向上し、DeAOTよりも3倍速いながら4.2 J&F向上しています。コードは以下のURLから入手可能です: https://hkchengrex.github.io/Cutie