2ヶ月前

オンライン適応畳み込みニューラルネットワークによる動画オブジェクトセグメンテーション

Paul Voigtlaender; Bastian Leibe
オンライン適応畳み込みニューラルネットワークによる動画オブジェクトセグメンテーション
要約

私たちは半教師ありビデオオブジェクトセグメンテーションの課題に取り組んでいます。これは、最初のフレームの真値ピクセルマスクを使用して、ビデオ内のオブジェクトに属するピクセルをセグメント化することです。最近導入されたワンショットビデオオブジェクトセグメンテーション(OSVOS)手法に基づいています。この手法は事前学習済みネットワークを使用し、最初のフレームで微調整を行います。印象的な性能を達成していますが、テスト時には微調整されたネットワークを変更せずに使用するため、オブジェクトの外観が大きく変化した場合に対応できません。この制限を克服するために、オンライン適応型ビデオオブジェクトセグメンテーション(OnAVOS)を提案します。これは、ネットワークの信頼度と空間構成に基づいて選択された訓練例を使用してオンラインでネットワークを更新します。さらに、PASCALデータセットで学習した物体性(objectness)に基づく事前学習ステップを追加しました。実験結果は、両方の拡張が非常に効果的であり、DAVISデータセットでの最新技術を交差率スコア85.7%に向上させることを示しています。