2ヶ月前

ビデオオブジェクトセグメンテーションのための空間時間記憶ネットワークの利用

Oh, Seoung Wug ; Lee, Joon-Young ; Xu, Ning ; Kim, Seon Joo
ビデオオブジェクトセグメンテーションのための空間時間記憶ネットワークの利用
要約

我々は半教師付きビデオオブジェクトセグメンテーションのための新しい解決策を提案します。この問題の本質から、利用可能な手がかり(例:オブジェクトマスク付きのビデオフレーム)は中間予測とともに豊かになります。しかし、既存の手法ではこの情報源を十分に活用することができません。我々はメモリネットワークを活用することで、利用可能なすべての情報源から関連情報を読み取る方法を学習し、この課題を解決します。我々のフレームワークでは、過去のオブジェクトマスク付きフレームが外部メモリを形成し、現在のフレームがクエリとして扱われ、メモリ内のマスク情報を使ってセグメンテーションされます。具体的には、クエリとメモリが特徴空間で密にマッチングされ、すべての時空間ピクセル位置が前向き伝播によってカバーされます。以前のアプローチとは対照的に、ガイド情報の豊富な使用により、外観変化や遮蔽などの課題をより適切に対処することができます。我々は最新のベンチマークセットで方法を検証し、最先端の性能(YouTube-VOS valセットでの総合スコア79.4、DAVIS 2016/2017 valセットでのJ値88.7および79.2)を達成しました。また、高速な実行時間(DAVIS 2016 valセットでの0.16秒/フレーム)も確保しています。

ビデオオブジェクトセグメンテーションのための空間時間記憶ネットワークの利用 | 最新論文 | HyperAI超神経