HyperAIHyperAI

Command Palette

Search for a command to run...

ボディランゲージデータセットを用いたノイジースチューデント学習が顔の表情認識を向上させる

Vikas Kumar Shivansh Rao Li Yu

概要

自然な動画における顔の表情認識は、豊富なラベル付き学習データが不足しているため、困難な課題である。大規模なDNN(深層ニューラルネットワーク)アーキテクチャやアンサンブル手法により性能は向上したが、データの不足によってやがて飽和状態に達してしまう。本論文では、ラベル付きデータセットとラベルなしデータセット(Body Language Dataset - BoLD)を組み合わせて利用する自己学習手法を用いる。実験的分析の結果、ノイズを含む学生ネットワークを反復的に訓練することで、顕著な性能向上が達成された。さらに、本モデルは顔の異なる領域を独立して処理するため、多段階のアテンション機構を採用しており、これにより性能がさらに向上している。本研究の結果から、提案手法は単一モデルとしてCK+およびAFEW 8.0というベンチマークデータセットにおいて、他の単一モデルと比較して最先端の性能を達成したことが示された。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています