Command Palette
Search for a command to run...
PANDA:深層属性モデリングのためのポーズアライメントネットワーク
PANDA:深層属性モデリングのためのポーズアライメントネットワーク
Zhang Ning Paluri Manohar Ranzato Marc'Aurelio Darrell Trevor Bourdev Lubomir
概要
我々は、視点、ポーズ、外見、関節構造、遮蔽などの大きな変動が生じる状況下における人物画像から、性別、髪型、服装スタイル、表情、動作といった人間の属性を推定する手法を提案する。畳み込みニューラルネットワーク(CNN)は、大規模な物体認識問題において優れた性能を発揮することが示されている。しかしながら、属性分類の文脈では、信号が微弱であり、画像のわずかな領域にしか現れない場合が多く、画像全体を支配するのはポーズや視点の影響である。ポーズの変動を補正するには、非常に大きなラベル付きデータセットでの学習が必要となるが、現時点ではそのようなデータセットは入手できない。部分ベースのモデル(例:PoseletsやDPM)は、本問題に対して良好な性能を示しているが、浅層の低レベル特徴に依存するという制限がある。本研究では、ポーズ正規化されたCNNを訓練することで、部分ベースのモデルと深層学習を組み合わせる新しい手法を提案する。実験の結果、制約のない環境下における挑戦的な属性分類タスクにおいて、従来の最先端手法と比較して顕著な性能向上が得られることを示した。さらに、本手法は、本問題に対する最良の部分ベースモデルおよび人物の全バウンディングボックスを用いて学習された従来のCNNを上回ることも確認された。