Command Palette
Search for a command to run...
高速オブジェクト検出のための統一的マルチスケール深層畳み込みニューラルネットワーク
高速オブジェクト検出のための統一的マルチスケール深層畳み込みニューラルネットワーク
Cai Zhaowei Fan Quanfu Feris Rogerio S. Vasconcelos Nuno
概要
複数スケールの物体検出を高速に行うため、統合型の深層ニューラルネットワーク(多スケールCNN、MS-CNN)が提案された。MS-CNNは、提案サブネットワークと検出サブネットワークの2つの部分から構成される。提案サブネットワークでは、複数の出力層で検出を実行することで、受容野を異なるスケールの物体に適合させる。これにより、各スケールに特化した補完的な検出器を統合し、強力な多スケール物体検出器を構築する。この統合ネットワークは、マルチタスク損失の最適化によりエンド・トゥ・エンドで学習される。また、入力のアップサンプリングに代わる手法として、デコンボリューションによる特徴量のアップサンプリングも検討され、メモリおよび計算コストの削減が図られている。KITTIやCaltechなど、多数の小物体を含むデータセットにおいて、最高15 fpsの速度で最先端の物体検出性能が達成された。