2ヶ月前
Fused DNN: 歩行者検出のための高速かつ堅牢な深層ニューラルネットワーク融合手法
Xianzhi Du; Mostafa El-Khamy; Jungwon Lee; Larry S. Davis

要約
歩行者検出のための高速かつ堅牢な深層ニューラルネットワーク融合アーキテクチャを提案します。本稿で提案するネットワーク融合アーキテクチャは、複数のネットワークを並列処理することで速度向上を実現します。単一ショット深層畳み込みニューラルネットワーク(Single Shot Deep Convolutional Network)は、オブジェクト検出器として訓練され、異なるサイズや遮蔽状態のすべての可能な歩行者候補を生成します。このネットワークは、大部分の真実値歩行者をカバーしつつ、多くの偽陽性も導入します。次に、複数の深層ニューラルネットワークが並列に使用され、これらの歩行者候補のさらなる洗練化を行います。我々はソフト拒否に基づくネットワーク融合手法を導入し、すべてのネットワークから得られるソフトメトリクスを統合して最終的な信頼度スコアを生成します。当手法は特に小型および遮蔽された歩行者の検出において既存の最先端技術よりも優れた性能を示しています。さらに、ピクセル単位での意味論的セグメンテーションネットワークをネットワーク融合アーキテクチャに組み込む方法を提案し、歩行者検出器に対する強化手段として利用します。この手法はCaltech Pedestrianデータセットにおけるほとんどのプロトコルで最先端技術を超える性能を発揮し、いくつかのプロトコルでは大幅な改善が見られます。また、他の全ての手法よりも高速です。