2ヶ月前
高速物体検出のための統一多尺度深層畳み込みニューラルネットワーク
Cai, Zhaowei ; Fan, Quanfu ; Feris, Rogerio S. ; Vasconcelos, Nuno

要約
多尺度畳み込みニューラルネットワーク(Multi-Scale CNN: MS-CNN)を高速な多尺度物体検出のために提案する。MS-CNNは、提案サブネットワークと検出サブネットワークから構成される。提案サブネットワークでは、複数の出力層で検出が行われ、受容器野が異なるスケールの物体に一致するように設計されている。これらの補完的なスケール固有の検出器は組み合わされて、強力な多尺度物体検出器を生成する。統合されたネットワークは、マルチタスク損失関数を最適化することでエンドツーエンドで学習される。また、入力のアップサンプリングの代わりに逆畳み込みによる特徴量アップサンプリングも探究され、これによりメモリや計算コストを削減することが可能となる。本手法は、小物体が多く含まれるKITTIやCaltechなどのデータセットにおいて最大15 fpsの最先端の物体検出性能を達成している。