15日前

ASMNet:顔のアライメントおよびポーズ推定のための軽量なディープニューラルネットワーク

Ali Pourramezan Fard, Hojjat Abdollahi, Mohammad Mahoor
ASMNet:顔のアライメントおよびポーズ推定のための軽量なディープニューラルネットワーク
要約

アクティブ形状モデル(Active Shape Model, ASM)は、対象となる構造の形状を統計的に表現するモデルであり、物体(例:顔)を表す点群を画像上に適合させる際に、機械学習アルゴリズムのガイドとして機能する。本論文では、野外環境における顔のアライメントおよび頭部ポーズ推定を目的として、ASMを損失関数に組み込んだ軽量な畳み込みニューラルネットワーク(Convolutional Neural Network, CNN)アーキテクチャ、すなわちASMNetを提案する。まず、ASMを用いてネットワークが顔のランドマーク点の滑らかな分布を学習するよう導く。転移学習のアイデアを参考に、訓練過程において徐々に回帰問題を厳しくし、ネットワークが元のランドマーク点分布を学習するように誘導する。損失関数内に複数のタスクを定義し、顔のランドマーク点検出と顔のポーズ推定の両方を同時に行う。複数の相関するタスクを同時に学習することで、タスク間の相乗効果が生じ、個々のタスクの性能が向上する。提案モデルASMNetは、ASMNetの約2倍のサイズを持つMobileNetV2と比較して、顔アライメントおよびポーズ推定の両タスクにおいて性能を評価した。困難なデータセット上での実験結果から、本研究で提案するASMを支援する損失関数を用いることで、ASMNetは顔アライメントタスクにおいてMobileNetV2と同等の性能を達成していることが示された。さらに、顔のポーズ推定においては、ASMNetはMobileNetV2よりもはるかに優れた性能を発揮した。ASMNetは、多くのCNNベースのモデルと比較して、パラメータ数および浮動小数点演算数が著しく少ないにもかかわらず、顔のランドマーク点検出およびポーズ推定において十分な性能を達成している。

ASMNet:顔のアライメントおよびポーズ推定のための軽量なディープニューラルネットワーク | 最新論文 | HyperAI超神経