
要約
注目度検出は、コンピュータビジョンにおける基本的な課題の一つです。効果的な特徴を抽出する方法は、注目度検出において重要なポイントです。最近の手法では、主に多尺度の畳み込み特徴を無差別に統合することを採用しています。しかし、すべての特徴が注目度検出に有用ではなく、一部は干渉を引き起こすこともあります。この問題を解決するために、我々はピラミッド特徴注意ネットワーク(Pyramid Feature Attention network)を提案します。このネットワークは、効果的な高レベルコンテキスト特徴と低レベル空間構造特徴に焦点を当てるためのものです。まず、多尺度高レベル特徴マップから豊富なコンテキスト特徴を捉えるために、コンテキスト認識型ピラミッド特徴抽出(Context-aware Pyramid Feature Extraction: CPFE)モジュールを設計しました。次に、CPFE 特徴マップの後にチャネルごとの注意(Channel-wise Attention: CA)を採用し、低レベル特徴マップの後に空間注意(Spatial Attention: SA)を使用してから、CA と SA の出力を融合させます。最後に、境界局在化におけるより詳細な情報を学習させるためにエッジ保存損失(edge preservation loss)を提案しました。5つのベンチマークデータセットでの広範な評価により、提案された手法が異なる評価指標において最先端のアプローチを超えることが示されました。