2ヶ月前

モーションサリエンシーをガイドとする時空間伝播を用いた無監督動画オブジェクトセグメンテーション

Yuan-Ting Hu; Jia-Bin Huang; Alexander G. Schwing
モーションサリエンシーをガイドとする時空間伝播を用いた無監督動画オブジェクトセグメンテーション
要約

非監督動画セグメンテーションは、物体識別から圧縮まで、多様な応用において重要な役割を果たしています。しかし、現在でも高速な動き、モーションブラー、およびオクルージョンが大きな課題となっています。これらの課題に対処するため、我々は光学フローとエッジの手がかりに基づいた新しい注目度推定技術と新しい近傍グラフを開発しました。当手法により、初期の前景・背景推定が大幅に改善され、時間軸上での堅牢かつ正確な拡散が可能になりました。我々は提案したアルゴリズムをDAVIS、SegTrack v2、FBMS-59という難易度の高いデータセットで評価しました。200枚の画像で学習された標準的なエッジ検出器のみを使用しているにもかかわらず、当方法は非監督設定において深層学習ベースの手法を上回る最先端の結果を達成しています。さらに、DAVISデータセットにおける半監督設定においても、深層学習ベースの手法と匹敵する競争力のある結果を示しています。注:- 「非監督動画セグメンテーション」: Unsupervised video segmentation- 「光学フロー」: Optical flow- 「エッジ検出器」: Edge detector- 「DAVIS」: DAVIS (Dataset for Video Object Segmentation)- 「SegTrack v2」: SegTrack v2 (Segmentation Tracking Evaluation Dataset version 2)- 「FBMS-59」: FBMS-59 (Freiburg-Berkeley Motion Segmentation Dataset)