12日前
画像内の顕著対象を検出するための段階的精緻化モデル
{Pingping Zhang, Ali Borji, Tiantian Wang, Lihe Zhang, Huchuan Lu}

要約
深層畳み込みニューラルネットワーク(CNN)は、顕著オブジェクト検出を含むコンピュータビジョン分野の多様な問題に成功裏に適用されてきた。顕著オブジェクトを正確に検出およびセグメンテーションするためには、高レベルの意味的特徴と低レベルの詳細な形状情報を同時に抽出・統合することが不可欠である。しかしながら、CNNでは、プーリングや畳み込みといった繰り返しのダウンサンプリング操作により、元の画像解像度が著しく低下し、空間的な詳細情報や微細構造が失われるという課題が生じる。この問題を克服するために、本研究では顕著性検出のための新たなピラミッドプーリングモジュールとマルチステージ精細化機構を、順伝播型ニューラルネットワークに組み込む手法を提案する。まず、深層順伝播ネットワークにより、詳細構造が失われた粗い予測マップを生成する。次に、局所的な文脈情報を統合した精細化ネットワークを、マスターブランチで生成された顕著性マップを段階的に改善する形で導入する。さらに、異なる領域に基づくグローバル文脈の集約を実現するため、ピラミッドプーリングモジュールを適用する。5つのベンチマークデータセットにおける実証的評価結果から、本手法は最先端のアプローチと比較しても優れた性能を示すことが明らかになった。