2ヶ月前
リアルタイムの注目物体検出のための単純なプーリングベース設計
Jiang-Jiang Liu; Qibin Hou; Ming-Ming Cheng; Jiashi Feng; Jianmin Jiang

要約
我々はPooling(プーリング)の役割を拡大することにより、注目物体検出の問題を解決する方法を探求しました。U字型アーキテクチャに基づき、まずボトムアップパスウェイ上にグローバルガイダンスモジュール(Global Guidance Module: GGM)を構築し、異なる特徴レベルの層に対して潜在的な注目物体の位置情報を提供することを目指しました。さらに、フィーチャー集約モジュール(Feature Aggregation Module: FAM)を設計し、トップダウンパスウェイからの細かいレベルの特徴量と粗いレベルの意味情報が適切に融合されるようにしました。トップダウンパスウェイでの融合操作後にFAMを追加することで、GGMからの粗いレベルの特徴量がさまざまなスケールの特徴量とシームレスに統合されます。これらの2つのプーリングベースのモジュールにより、高レベルの意味特徴量が段階的に洗練され、詳細豊かなサリエンシーマップが生成されます。実験結果は、提案手法が以前の最先端技術よりも精度高く注目物体を位置特定できることを示しており、その性能は大幅に向上しています。また、本手法は高速であり、$300 \times 400$ の画像処理において30 FPS以上の速度で動作します。コードは http://mmcheng.net/poolnet/ から入手可能です。