2ヶ月前
歩行者検出のための注目度と境界ボックスアライメントを使用した部品レベルの畳み込みニューラルネットワーク
Inyong Yun; Cheolkon Jung; Xinran Wang; Alfred O Hero; Joongkyu Kim

要約
動画中の歩行者は、体の姿勢、遮蔽、複雑な背景など、多様な外見を持っています。歩行者検出においては、提案領域のずれ(proposal shift)問題により頭や足などの体部位が欠落することがあります。本論文では、この問題を解決するために、サリエンシーと境界ボックスアライメントを使用した部分レベルの畳み込みニューラルネットワーク(CNN)を提案します。提案するネットワークは、検出サブネットワークとアライメントサブネットワークの2つの部分から構成されています。検出サブネットワークでは、電柱や木などの誤検出を除去するためにサリエンシーを利用します。アライメントサブネットワークでは、提案領域のずれ問題に対処するために境界ボックスアライメントを採用します。まず、FCN(全結合層付き畳み込みニューラルネットワーク)とCAM(クラス活性化マッピング)を組み合わせて歩行者検出に必要な深層特徴を抽出します。次に、部分レベルのCNNを用いて欠落した体部位を再認識します。様々なデータセットでの実験結果は、提案手法が歩行者検出の精度を大幅に向上させることを示しており、画像あたりの偽陽性数(FPPI)に対する対数平均ミス率という指標で既存の最先端手法よりも優れていることが確認されました。