2ヶ月前

Faster R-CNN: リージョン提案ネットワークを用いたリアルタイム物体検出への道程

Shaoqing Ren; Kaiming He; Ross Girshick; Jian Sun
Faster R-CNN: リージョン提案ネットワークを用いたリアルタイム物体検出への道程
要約

最先端の物体検出ネットワークは、物体の位置を仮説立てるための領域提案アルゴリズムに依存しています。SPPnetやFast R-CNNなどの進歩により、これらの検出ネットワークの実行時間が短縮されましたが、領域提案の計算がボトルネックとなっています。本研究では、検出ネットワークと共有して全画像の畳み込み特徴量を生成するRegion Proposal Network (RPN) を導入します。これにより、ほぼコストゼロで領域提案を行うことが可能になります。RPNは、各位置で物体の境界と物体性スコアを同時に予測する完全な畳み込みネットワークです。RPNはエンドツーエンドで学習され、高品質な領域提案を生成します。これらの提案はFast R-CNNによって検出に使用されます。さらに、RPNとFast R-CNNの畳み込み特徴量を共有することで単一のネットワークに統合しました。最近注目されている「注意」メカニズムを持つニューラルネットワークの用語を使用すると、RPNコンポーネントは統合されたネットワークに対してどこを見るべきかを指示します。非常に深いVGG-16モデルを使用した場合、当社の検出システムはGPU上で5fps(すべてのステップを含む)を達成し、PASCAL VOC 2007、2012およびMS COCOデータセットにおいて最新の物体検出精度を達成しています(1画像あたり300つの提案のみ)。ILSVRCおよびCOCO 2015競技大会では、Faster R-CNNとRPNが複数トラックでの優勝作品の基礎となっています。コードは公開されています。

Faster R-CNN: リージョン提案ネットワークを用いたリアルタイム物体検出への道程 | 最新論文 | HyperAI超神経