2ヶ月前
マスクを用いた歩行認識
Shen, Chuanfu ; Lin, Beibei ; Zhang, Shunli ; Huang, George Q. ; Yu, Shiqi ; Yu, Xin

要約
多くの歩行認識手法は、静的な外観と動的な歩行パターンから空間時間表現を活用しています。しかし、我々は多くの部位ベースの手法が境界での表現を無視していることに注目しました。さらに、歩行認識において訓練データに対する過学習(オーバーフィッティング)現象が比較的一般的であることを観察しており、これはおそらくデータの不足や情報量の少ない歩行シルエットに起因するものです。これらの観察に基づき、我々は新しいマスクベースの正則化手法であるReverseMaskを提案します。特徴マップに摂動を注入することで、提案された正則化手法は畳み込み構造が識別的な表現を学習し、汎化能力を向上させることに役立ちます。また、Inception風のReverseMaskブロックを設計しました。このブロックには、グローバルブランチ、特徴ドロップブランチ、および特徴スケーリングブランチという3つのブランチがあります。具体的には、ドロップブランチは部分的な活性化がゼロアウトされる際に細かい表現を抽出できます。一方で、スケーリングブランチは特徴マップを無作為にスケール変換し、活性化の構造情報を維持しつつ過学習を防ぎます。プラグアンドプレイ型のInception風ReverseMaskブロックは単純かつ効果的にネットワークの汎化能力を向上させ、多くの最先端手法の性能も向上させます。広範な実験により、ReverseMask正則化がベースラインモデルの精度向上とより良い汎化能力に寄与することが示されました。さらに、Inception風ブロックを使用したベースラインモデルは最も人気のある2つのデータセットCASIA-BとOUMVLPにおいて最先端手法よりも著しく優れた性能を発揮しました。ソースコードは公開されます。