18日前

ラベル分布学習を用いたロバストで軽量な顔認識表情認識ネットワーク

{Feng Zhou, Qingshan Liu, Zengqun Zhao}
要約

本稿では、実用的かつ高いロバスト性を備えた顔面感情認識(FER)ネットワーク「EfficientFace」を提案する。このネットワークはパラメータ数が非常に少ない一方で、実世界環境下におけるFERに対して極めて頑健である。まず、軽量ネットワークのロバスト性を向上させるために、局所特徴抽出器とチャネル・空間モジュレータを設計した。これらのモジュールでは深度方向畳み込み(depthwise convolution)を用いることで、ネットワークが顔面の局所的およびグローバルな顕著特徴を同時に捉える能力を持つようになった。次に、多くの感情が基本感情の組み合わせ、混合、または複合として現れるという事実を考慮し、シンプルかつ効率的なラベル分布学習(Label Distribution Learning, LDL)法を新たな学習戦略として導入した。実際のオクルージョンやポーズ変動を含むデータセット上での実験により、提案手法EfficientFaceがオクルージョンやポーズ変動条件下でも高いロバスト性を示すことが確認された。さらに、RAF-DB、CAER-S、AffectNet-7データセットにおいて、それぞれ88.36%、85.87%、63.70%の精度で最先端の性能を達成し、AffectNet-8データセットにおいても59.89%の高い精度を記録し、他の手法と同等の性能を発揮した。