
要約
本研究では、対象オブジェクトおよび背景に関するユーザーのアノテーションを受け入れるインタラクティブ画像セグメンテーションアルゴリズムを提案する。まず、ユーザーによるアノテーション位置から各画素までの距離を測定することで、インタラクションマップを生成する。次に、畳み込みニューラルネットワーク(CNN)におけるフォワードパスを実行し、初期のセグメンテーションマップを出力する。しかし、初期の結果ではユーザーによるアノテーション位置が誤分類される場合がある。そこで、誤分類された画素を修正するためのバックプロパゲーションによる精緻化スキーム(Backpropagating Refinement Scheme: BRS)を提案する。実験結果により、提案手法が4つの挑戦的なデータセットにおいて従来手法を上回ることを示した。さらに、既存の畳み込みニューラルネットワークをユーザーインタラクティブなモデルに変換することで、BRSの汎用性と他のコンピュータビジョンタスクへの適用可能性を実証した。