2ヶ月前

深層対話型オブジェクト選択

Ning Xu; Brian Price; Scott Cohen; Jimei Yang; Thomas Huang
深層対話型オブジェクト選択
要約

対話型オブジェクト選択は非常に重要な研究課題であり、多くの応用があります。従来のアルゴリズムでは、前景と背景の分布を推定するためにユーザーからの多大な対話を必要としていました。本論文では、オブジェクト性に対する理解が大幅に向上した新しい深層学習ベースのアルゴリズムを提案します。このアルゴリズムは、ユーザーが提供する肯定的なクリックと否定的なクリックを2つのユークリッド距離マップに変換し、これらのマップを画像のRGBチャネルと結合して(画像、ユーザーアクション)ペアを作成します。我々は、ユーザーのクリックパターンをモデル化するためにいくつかのランダムサンプリング戦略を組み合わせて多くのこのようなペアを生成し、それらを使用して深層完全畳み込みネットワーク(Deep Fully Convolutional Networks, FCNs)を微調整します。最後に、FCN 8sモデルの出力確率マップをグラフカット最適化と統合して境界セグメントを精緻化します。我々のモデルはPASCALセグメンテーションデータセットで学習され、異なるオブジェクトクラスを持つ他のデータセットで評価されました。既知および未知のオブジェクトに対する実験結果は明確に示しており、我々のアルゴリズムは優れた汎化能力を持ち、既存のすべての対話型オブジェクト選択手法よりも優れています。