3ヶ月前

複数のデータセットにおける一貫性の欠如するラベル付け基準を用いた顔面感情認識のための統合学習

{Ming Li, Wei Zou, Dong Zhang, Chengyan Yu}
複数のデータセットにおける一貫性の欠如するラベル付け基準を用いた顔面感情認識のための統合学習
要約

顔面表情認識(FER)の性能を向上させる可能性のある手法の一つは、トレーニングデータセットを拡張し、サンプル数を増やすことである。複数のFERデータセットを統合することで、ディープラーニングモデルはより判別力の高い特徴を抽出できる。しかし、アノテーションされたFERデータセットにはラベル付け基準の不整合や主観的なバイアスが存在するため、異なるデータセットを統合して利用する際、ディープラーニングモデルの認識精度が著しく低下する可能性がある。複数のデータセットを効果的に共同で学習させるという課題は依然として困難である。本研究では、複数のFERデータセットを用いたFERモデルの共同学習手法を提案する。本手法は以下の4段階から構成される:(1)追加データセットからサブセットを選択する、(2)ターゲットデータセットに対して擬似連続ラベルを生成する、(3)ターゲットデータセットのラベル付け基準に基づき、連続ラベルマッピングと離散ラベル再ラベリングを用いて各データセットのラベルを精緻化する、(4)マルチタスク学習を用いてモデルを共同で訓練する。本研究では、代表的な野外環境用FERベンチマークデータベースであるRAF-DBとCAER-Sを対象に共同学習実験を行い、AffectNetデータセットを追加データセットとして活用した。実験結果から、本手法は異なるFERデータセットを単純に統合した場合よりも優れた性能を示し、RAF-DBおよびCAER-Sにおいてそれぞれ92.24%および94.57%の精度を達成し、両データセットで最先端の性能を実現した。