2ヶ月前
物体検出のための特徴ピラミッドネットワーク
Tsung-Yi Lin; Piotr Dollár; Ross Girshick; Kaiming He; Bharath Hariharan; Serge Belongie

要約
特徴ピラミッドは、異なるスケールの物体を検出する認識システムにおける基本的な構成要素です。しかし、最近の深層学習による物体検出器では、計算量とメモリ使用量が多いため、ピラミッド表現を避ける傾向があります。本論文では、深層畳み込みネットワークに内在する多スケールのピラミッド階層を利用し、僅かな追加コストで特徴ピラミッドを構築する方法を提案します。全スケールにおいて高レベルの意味的な特徴マップを生成するために、トップダウンアーキテクチャと横方向接続(lateral connections)を開発しました。このアーキテクチャは特徴ピラミッドネットワーク(Feature Pyramid Network, FPN)と呼ばれ、一般的な特徴抽出器としていくつかの応用で著しい改善を示しています。FPN を基本的な Faster R-CNN システムに組み込むことで、当該手法は COCO 検出ベンチマークにおいて単一モデル結果で最先端の性能を達成し、COCO 2016 チャレンジの勝者を含む既存のすべての単一モデルエントリーを超える結果を得ました。さらに、当該手法は GPU 上で 5 FPS の速度で動作可能であり、実用的かつ正確な多スケール物体検出ソリューションとなっています。コードは公開される予定です。