18日前

野生環境下における顔面表情認識のためのスーパーレゾリューション搭載ピラミッド構造

{Soo-Hyung Kim, Hyung-Jeong Yang, Guee-Sang Lee, Thanh-Hung Vo}
要約

顔面表情認識(Facial Expression Recognition, FER)は、自然な人間-コンピュータインタラクションを向上させる上で挑戦的な課題である。本論文では、単一のウェルド(in-the-wild, ITW)画像における自動FERに焦点を当てる。ITW画像は、姿勢の変化、視線の方向、入力解像度の低さといった実際の課題に直面している。本研究では、これらの課題を克服するため、スーパーレゾリューションを統合したピラミッド構造(Pyramid with Super-Resolution, PSR)ネットワークアーキテクチャを提案する。さらに、FERタスクにおける各表情の混同に関する追加的な事前知識を反映する、事前分布ラベルスムージング(Prior Distribution Label Smoothing, PDLS)損失関数を導入する。最も代表的な3つのITW FERデータセットにおける実験結果から、本手法が従来の最先端手法を上回ることを確認した。