17日前

ボディランゲージデータセットを用いたノイジースチューデント学習が顔の表情認識を向上させる

Vikas Kumar, Shivansh Rao, Li Yu
ボディランゲージデータセットを用いたノイジースチューデント学習が顔の表情認識を向上させる
要約

自然な動画における顔の表情認識は、豊富なラベル付き学習データが不足しているため、困難な課題である。大規模なDNN(深層ニューラルネットワーク)アーキテクチャやアンサンブル手法により性能は向上したが、データの不足によってやがて飽和状態に達してしまう。本論文では、ラベル付きデータセットとラベルなしデータセット(Body Language Dataset - BoLD)を組み合わせて利用する自己学習手法を用いる。実験的分析の結果、ノイズを含む学生ネットワークを反復的に訓練することで、顕著な性能向上が達成された。さらに、本モデルは顔の異なる領域を独立して処理するため、多段階のアテンション機構を採用しており、これにより性能がさらに向上している。本研究の結果から、提案手法は単一モデルとしてCK+およびAFEW 8.0というベンチマークデータセットにおいて、他の単一モデルと比較して最先端の性能を達成したことが示された。