2ヶ月前
PANDA: 姿勢アライメントネットワークによる深層属性モデリング
Zhang, Ning ; Paluri, Manohar ; Ranzato, Marc'Aurelio ; Darrell, Trevor ; Bourdev, Lubomir

要約
私たちは、視点、姿勢、外見、関節の動き、および隠蔽が大きく変動する人の画像から、人間の属性(性別、髪型、服装スタイル、表情、行動)を推論する方法を提案します。畳み込みニューラルネットワーク(CNN)は大規模な物体認識問題において非常に優れた性能を示しています。しかし、属性分類の文脈では信号がしばしば微妙であり、画像の一部だけをカバーしている場合があり、画像の大半は姿勢や視点の影響によって支配されています。姿勢変動に対する補正を行うには非常に大量のラベル付きデータセットでの学習が必要ですが、現在そのようなデータセットは利用できません。ポーズレットやDPMなどの部位ベースモデルはこの問題に対して良好な性能を示していますが、浅い低レベル特徴に制限されます。私たちは部位ベースモデルと深層学習を組み合わせた新しい方法を提案し、姿勢正規化されたCNNで学習を行います。実験結果は、無制約環境における挑戦的な属性分類タスクにおいて現行の最先端手法よりも大幅に改善することを示しており、本手法がこの問題における最良の部位ベースモデルや人物全体のバウンディングボックスで学習した従来のCNNよりも優れていることを確認しています。