2ヶ月前
非局所的ディープ特徴による顕著オブジェクト検出
{Pierre-Marc Jodoin, Justin Eichel, Shaozi Li, Andrew Achkar, Zhiming Luo, Akshaya Mishra}

要約
サリエンシー検出は、画像内における最も関連性の高いオブジェクトを強調することを目的としている。従来のモデルを用いた手法は、サリエントなオブジェクトが複雑な背景上に配置されている場合に困難に直面する一方、深層ニューラルネットワークは過剰な構造の複雑さと遅い評価速度という課題を抱えている。本論文では、多スケール4×5グリッド構造を用いて局所情報とグローバル情報を統合する簡略化された畳み込みニューラルネットワークを提案する。通常行われるCRFやスーパーピクセルによる空間的一貫性の強制ではなく、ムムフォード・シャー functional に着想を得た損失関数を導入し、境界上の誤差に対してペナルティを課す。我々はMSRA-Bデータセットを用いてモデルを学習し、6つの異なるサリエンシーベンチマークデータセットで評価を行った。実験結果から、本手法は最先端の性能と同等の精度を達成しつつ、計算時間を最大で18~100倍短縮できることを示した。これにより、近似リアルタイムかつ高精度なサリエンシー検出が実現可能となった。