2ヶ月前

多視点動的顔のアクションユニット検出

Andres Romero; Juan Leon; Pablo Arbelaez
多視点動的顔のアクションユニット検出
要約

私たちは、多視点動的顔アクションユニット検出の微細認識問題を解決するための新しい畳み込みニューラルネットワーク(CNN)アプローチを提案します。本研究では、大規模物体認識における最近の進歩を活用し、人間の顔の静止画像において特定のアクションユニットが存在するかどうかを予測するタスクを全体的な分類として定式化しています。次に、個々のアクションユニットに対して共有表現と独立表現を考慮し、色情報と動き情報を組み合わせるための異なるCNNアーキテクチャについて探求します。FERA 2017チャレンジで提案された新しい設定に移行し、ビデオが撮影された視点を最初に予測し、その後その特定の視点のために訓練されたアクションユニット検出器群を評価する多視点拡張アプローチを提案します。私たちのアプローチは全体的であり、効率的かつモジュール型であるため、新たなアクションユニットをシステム全体に容易に追加することができます。当該アプローチはFERA 2017チャレンジのベースラインに対してF1値で絶対的に14%向上しており、大幅な性能向上が確認されています。さらに、FERA 2017チャレンジの優勝者と比較しても有利な結果となっています。ソースコードはhttps://github.com/BCV-Uniandes/AUNetsで利用可能です。