17日前
CAGE:循環性感情を用いた表現推論
Niklas Wagner, Felix Mätzler, Samed R. Vossberg, Helen Schneider, Svetlana Pavlitska, J. Marius Zöllner

要約
感情と表情の理解は、ユーザー体験の向上を目的とした複数の分野において重要な課題である。一般的な認識とは異なり、感情は離散的な存在ではなく、連続的なスペクトル上に存在することが明らかになっている。文化的背景、個人の経験、認知バイアスなどの多様な要因により、人々は離散的な感情を異なる方法で捉えている。その結果、特に離散的なカテゴリに依存する表情理解アプローチは、本質的にバイアスを含んでいる。本論文では、感情の円周モデル(circumplex model of affect)の構成要素を備えた2つの代表的なデータセット(AffectNet および EMOTIC)について、包括的な比較分析を行う。さらに、軽量アプリケーションに適した顔面表情予測モデルを提案する。小規模なMaxViTベースのモデルアーキテクチャを用いて、訓練時に離散的な表情カテゴリラベルに加えて連続的な価値(valence)と覚醒(arousal)ラベルを考慮した場合の影響を評価した。その結果、離散的カテゴリラベルに加えて価値と覚醒を考慮することで、表情推論性能が顕著に向上することが示された。提案モデルはAffectNetにおいて現行の最先端モデルを上回り、価値と覚醒の推定において最も優れた性能を達成し、RMSEが7%低減した。本研究の再現に必要な学習スクリプトおよび学習済み重みは、以下のGitHubリポジトリにて公開されている:https://github.com/wagner-niklas/CAGE_expression_inference。