16日前

顔面美の分布予測とCNNアンサンブルを用いた分析

{Hassan Ugail, Millie Hope Saffery, Tazkia Hoodh Jayatileke, Noah Hassan Ugail, Ahmed Aman Ibrahim}
要約

顔面美の予測(Facial Beauty Prediction: FBP)は、顔の美しさを定量的に評価するコンピュータビジョンの課題である。近年の深層学習の進展により、この問題に対する複数の解決策が大きな恩恵を受けている。しかし、現在の大多数の手法は、機械学習モデルを単に平均的な美しさスコアを予測するように訓練しており、FBPを単なる回帰タスクとして扱っている。さらに、これまでの深層学習ベースのFBPアプローチは、ImageNetなどの一般分類タスクで事前学習されたモデルを転移学習によって活用している。本研究では、顔認証タスクで事前学習された複数の畳み込みニューラルネットワーク(CNN)モデルのアンサンブルを、Earth Mover's Distance(EMD)に基づく損失関数を含む多様な損失関数を用いて微調整する手法を提案する。このアプローチにより、平均スコアだけでなく、美しさスコアの全体的な分布を予測可能となり、予測された平均スコアは真のスコアとの間に高いピアソン相関(PC)を達成する。本手法は、MEBeautyデータセットにおいて、平均絶対誤差(MAE)、平均二乗誤差(RMSE)、および予測平均スコアと真の平均スコア間のピアソン相関(PC)という指標において、従来の最先端手法を上回る結果を達成した。