2ヶ月前

表情行動理解のための表現学習とアイデンティティ対抗訓練

Ning, Mang ; Salah, Albert Ali ; Ertugrul, Itir Onal
表情行動理解のための表現学習とアイデンティティ対抗訓練
要約

顔のアクションユニット(AU)検出は、複雑な表情を個々の筋肉の動きに分解する能力により、大きな注目を集めています。本論文では、AU検出における2つの基本的な要因である多様で大規模なデータと被験者アイデンティティ正則化に再び焦点を当てます。最近の基礎モデルの進歩に触発されて、データの重要性を強調し、複数の公開ソースから900万枚の顔画像を収集した多様なデータセット「Face9M」を紹介します。Face9M上でマスク付きオートエンコーダーを事前学習することで、AU検出および表情認識タスクにおいて優れた性能が得られます。さらに重要な点として、アイデンティティ対抗訓練(IAT)がAUタスクにおいて十分に探究されていないことを指摘します。このギャップを埋めるために、まず被験者のアイデンティティがAUデータセット内でモデルのショートカット学習を引き起こし、最適でないAU予測解につながることを示します。次に、アイデンティティ不変特徴量を学習するために強いIAT正則化が必要であることを実証します。最後に、IATの設計空間について説明し、実験的にIATがアイデンティティに基づくショートカット学習を回避し、より良い解につながることを示します。我々が提案する方法である顔マスク付きオートエンコーダー(FMAE)とIATは単純かつ汎用的であり、効果的です。特に提案されたFMAE-IATアプローチはBP4D(67.1%)、BP4D+(66.8%)、DISFA(70.1%)データベースにおいて新しい最先端のF1スコアを達成しており、以前の研究よりも大幅に優れています。コードとモデルはhttps://github.com/forever208/FMAE-IATで公開しています。

表情行動理解のための表現学習とアイデンティティ対抗訓練 | 最新論文 | HyperAI超神経