12日前

コンテンツに応じたマルチレベルガイドによるインタラクティブインスタンスセグメンテーション

{ Angela Yao, Soumajit Majumder}
コンテンツに応じたマルチレベルガイドによるインタラクティブインスタンスセグメンテーション
要約

インタラクティブインスタンスセグメンテーションにおいて、ユーザーは反復的にフィードバックを提供することでセグメンテーションマスクを精緻化します。ユーザーが入力するクリックは、関心対象オブジェクトの位置に関する必要情報をネットワークに提供するためのガイダンスマップに変換されます。現在のシステムで用いられているガイダンスマップは、すべて距離に基づくものであり、局所的すぎたり、情報量が不足しているという問題があります。本研究では、画像に内在する階層的構造情報を活用する、コンテンツに配慮したガイダンスマップを生成するための新たなクリック変換手法を提案します。本手法により、最も基本的なFCN(畳み込みニューラルネットワーク)でも、大規模なセグメンテーションデータセットで事前学習された最先端のセグメンテーションネットワークを必要とする従来手法を上回る性能を達成できます。さらに、4つの標準的なインタラクティブセグメンテーションベンチマークにおいて、包括的な実験を通じて本手法の有効性を実証し、いずれのベンチマークでも既存の最良性能を大幅に上回ることを示しました。