2ヶ月前

反復的に簡単な参照フレームを選択することで、教師なしビデオオブジェクトセグメンテーションが容易になる

Youngjo Lee; Hongje Seong; Euntai Kim
反復的に簡単な参照フレームを選択することで、教師なしビデオオブジェクトセグメンテーションが容易になる
要約

非監督動画オブジェクトセグメンテーション(UVOS)は、動画において前景オブジェクトを背景から分離することを目指すピクセル単位の二値ラベリング問題であり、前景オブジェクトの真のマスク(GT マスク)を使用せずに実行されます。これまでの UVOS モデルの多くは、最初のフレームまたは全体の動画を参考フレームとして使用して、前景オブジェクトのマスクを指定しています。しかし、なぜ最初のフレームを選択する必要があるのか、またはなぜ全体の動画を使用してマスクを指定するのかという疑問が残ります。私たちは、最初のフレームや全体の動画だけでなく、より良い参考フレームを選択することで UVOS の性能を向上させられると考えています。本論文では、Easy Frame Selector (EFS) を提案します。EFS は、「簡単な」参考フレームを選択し、その後の VOS を容易にすることで VOS の性能を向上させる機能を持っています。さらに、Iterative Mask Prediction (IMP) という新しい枠組みも提案します。この枠組みでは、与えられた動画に対して EFS を繰り返し適用し、前回の反復よりも「より簡単な」参考フレームを選択することで、VOS の性能を段階的に向上させます。IMP は EFS, 双方向マスク予測 (BMP), および時間情報更新 (TIU) で構成されています。提案された枠組みにより、DAVIS16, FBMS, SegTrack-V2 の3つの UVOS ベンチマークセットで最先端の性能を達成しました。

反復的に簡単な参照フレームを選択することで、教師なしビデオオブジェクトセグメンテーションが容易になる | 最新論文 | HyperAI超神経