2ヶ月前

中心とスケール予測:歩行者および顔検出のためのアンカーなしアプローチ

Wei Liu; Irtiza Hasan; Shengcai Liao
中心とスケール予測:歩行者および顔検出のためのアンカーなしアプローチ
要約

物体検出は、伝統的にはスライドウィンドウ分類器を、現代の深層学習アプローチではアンカーボックスに基づく予測を必要とします。しかし、これらのいずれのアプローチもボックスの設定に煩雑な作業が必要です。本論文では、物体検出を高レベルの意味的特徴検出タスクとして捉える新たな視点を提供します。エッジ、コーナー、ブロブなどの他の特徴検出器と同様に、提案された検出器は画像全体で特徴点を探しますが、これは畳み込み操作に自然に適しています。ただし、これらの伝統的な低レベルの特徴とは異なり、提案された検出器はより高い抽象度を目指しており、つまり対象物がある中心点を見つけます。そして、現代の深層モデルはすでにこのような高レベルの意味的抽象化を行う能力を持っています。さらに、ブロブ検出と同様に、中心点のスケールも予測しますが、これも単純な畳み込み操作で行えます。したがって、本論文では歩行者検出や顔検出を畳み込みを通じた単純な中心点とスケール予測タスクとして簡素化しています。この方法により、提案手法はボックスを使用しない設定を実現しています。構造は単純ですが、歩行者検出や顔検出などいくつかの課題のあるベンチマークにおいて競争力のある精度を示しています。さらにクロスデータセット評価を行い、提案手法の優れた汎化能力を示しました。コードとモデルは以下のURLからアクセスできます(https://github.com/liuwei16/CSP および https://github.com/hasanirtiza/Pedestron)。