2ヶ月前
ResEmoteNet: 顔の感情認識における精度向上と損失低減の橋渡し
Roy, Arnab Kumar ; Kathania, Hemant Kumar ; Sharma, Adhitiya ; Dey, Abhishek ; Ansari, Md. Sarfaraj Alam

要約
人間の顔は無言のコミュニケーションツールであり、表情を通じて感情や思考を表現します。近年のコンピュータビジョンの進歩により、顔の感情認識技術が大きく進展し、機械が顔の微妙なサインを解読できるようになりました。本研究では、Convolutional(畳み込み)、Squeeze-Excitation (SE) ブロック、および Residual Networks(残差ネットワーク)を組み合わせた新しい深層学習アーキテクチャである ResEmoteNet を提案します。SE ブロックの導入により、人間の顔の重要な特徴に選択的に焦点を当てることができ、特徴表現を強化し、関連性の低い特徴を抑制します。これにより損失が減少し、全体的なモデル性能が向上します。また、SE ブロックを3つの残差ブロックと統合することで、より深い層を通じてデータのより複雑な表現を学習することができます。ResEmoteNet の評価は4つのオープンソースデータベース(FER2013, RAF-DB, AffectNet-7, ExpW)で行われました。それぞれで79.79%、94.76%、72.39%、75.67% の精度を達成しました。提案されたネットワークは、これら4つのデータベース全てにおいて最先端モデルを超える性能を示しています。ResEmoteNet のソースコードは https://github.com/ArnabKumarRoy02/ResEmoteNet から入手可能です。