顔の表情は、感情を幅広く伝える重要な非言語的コミュニケーション形式である。近年、人工知能およびコンピュータビジョン分野の進展により、特に畳み込みニューラルネットワーク(CNN)を活用した深層学習手法が、顔面感情認識(FER)において高い効果を発揮している。本論文では、改良型ConvNeXtアーキテクチャを基盤とし、複数の重要な革新を統合した高度な深層学習フレームワーク「EmoNeXt」を提案する。EmoNeXtは、顔面の最も表現力のある領域に注目できるようにする空間変換ネットワーク(Spatial Transformer Networks)を組み込み、チャネル間の依存関係を強化する squeeze-and-excitation ブロックを導入するとともに、コンパクトかつ判別性の高い特徴ベクトルの学習を促進する自己注意正則化項を採用している。初期評価ではFER2013データセットを用いて検証したが、本研究ではさらに広く用いられているベンチマークデータセットAffectNetおよびCK+を用いた追加評価を通じて、実世界の自然な状況およびポーズされた状況の両方において、EmoNeXtの高い堅牢性と汎化能力を実証している。さらに、各技術的改良の貢献度を定量的に分析するための包括的なアブレーションスタディを実施し、それらがモデル性能向上に有意な効果をもたらしていることを確認した。最後に、本論文ではEmoNeXtがアルツハイマー病を患う高齢者における感情認識に応用可能な可能性について検討し、患者ケアの質を向上させるために正確な感情認識技術の必要性を強調している。本研究の結果は、神経変性疾患を有する患者を対象とした医療現場において、EmoNeXtが感情的コミュニケーションを強化する貴重なツールとして活用可能であることを示している。