2ヶ月前

多尺度前景背景統合による協調的なビデオオブジェクトセグメンテーション

Zongxin Yang; Yunchao Wei; Yi Yang
多尺度前景背景統合による協調的なビデオオブジェクトセグメンテーション
要約

本論文では、挑戦的な半教師付きビデオオブジェクトセグメンテーションの課題を解決するための埋め込み学習の原理を調査しています。従来の手法が前景オブジェクト(Foreground Object)の埋め込み学習に焦点を当てるのとは異なり、背景も同様に扱うべきであると考えています。したがって、我々は前景-背景統合による協調型ビデオオブジェクトセグメンテーション(Collaborative Video Object Segmentation by Foreground-Background Integration: CFBI)アプローチを提案します。CFBIは特徴量埋め込みを前景オブジェクト領域とそれに対応する背景領域に分離し、これらがより対照的になるように促進することで、セグメンテーション結果を向上させます。さらに、CFBIは参照シーケンスと予測シーケンス間でピクセルレベルのマッチングプロセスとインスタンスレベルの注意メカニズムを行います。これにより、さまざまなオブジェクトサイズに対してCFBIは堅牢性を持つことができます。CFBIに基づいて、我々は多尺度マッチング構造を導入し、Atrous Matching戦略を提案します。これにより、より堅牢で効率的なフレームワークCFBI+が実現しました。DAVISおよびYouTube-VOSという2つの人気ベンチマークデータセットにおいて広範な実験を行い、事前学習にシミュレーションデータを使用せずに、我々のCFBI+は性能(J&F)82.9%および82.8%を達成しました。これは他の最先端手法よりも優れた結果です。コード: https://github.com/z-x-yang/CFBI

多尺度前景背景統合による協調的なビデオオブジェクトセグメンテーション | 最新論文 | HyperAI超神経