2ヶ月前
FODVid: フロー誘導型オブジェクト発見ビデオ
Singh, Silky ; Deshmukh, Shripad ; Sarkar, Mausoom ; Jain, Rishabh ; Hemani, Mayur ; Krishnamurthy, Balaji

要約
動画中の物体分割は、モーションブラー、パララックス、オクルージョン、照明の変化などの微妙な違いにより困難を伴います。これらの微妙な違いを個別に対処するのではなく、個々の複雑さに過学習しない汎用的な解決策に焦点を当てます。このような解決策は、動画コーパスの人間によるアノテーションにかかる莫大なリソースを節約することにも役立ちます。無教師設定でのビデオオブジェクトセグメンテーション(VOS)を解くために、フローガイドグラフカットと時間的一貫性を使用してセグメンテーション出力をガイドする新しいパイプライン(FODVid)を提案します。基本的には、フレーム内での外観とフローの類似性、ならびに対象となる物体のフレーム間での時間的継続性を取り入れたセグメンテーションモデルを設計しています。我々は標準的なDAVIS16動画ベンチマークに対して、この単純な手法の広範な実験分析を行いました。単純であるにもかかわらず、我々の手法は既存の無教師VOSにおける最上位の手法と比較可能な結果(約2 mIoUの範囲内)を生成します。我々の技術の単純さと効果性は、動画領域における新たな研究方向を開く可能性があります。