
要約
顕著対象検出は、コンピュータビジョンにおける基礎的なタスクである。現在の大多数のアルゴリズムは、事前に学習された畳み込みニューラルネットワーク(CNN)のマルチレベル特徴量を集約することに注力している。また、一部の研究者はエッジ情報を利用して補助的な学習を試みている。しかし、既存のエッジ意識型モデルは、単方向のフレームワークを採用しており、エッジ特徴量を用いてセグメンテーション特徴量を改善するのみである。本研究では、二値セグメンテーションとエッジマップの論理的関係性に着目し、顕著対象検出のための新しいスタック型クロスリファインメントネットワーク(Stacked Cross Refinement Network, SCRN)を提案する。本フレームワークは、クロスリファインメントユニット(Cross Refinement Unit, CRU)をスタックすることで、顕著対象検出とエッジ検出の両タスクにおけるマルチレベル特徴量を同時に精緻化することを目的としている。論理的な関係性に基づき、CRUは2つの方向特有の統合操作を設計し、両タスク間で双方向にメッセージを伝達する。精緻化されたエッジ保持特徴量を従来のU-Net構造と統合することで、本モデルは顕著対象を高精度に検出することができる。6つのベンチマークデータセットを用いた広範な実験により、本手法が既存の最先端アルゴリズムと比較して、精度と効率の両面で優れた性能を発揮することが示された。さらに、SOCデータセットにおける属性別評価では、多数の困難なシーンにおいて本モデルが首位を獲得している。コードは https://github.com/wuzhe71/SCAN にて公開されている。