17日前

顔面ランドマークを用いずに単一画像から実年齢および顕在年齢の深い期待値を推定する

{Luc van Gool, Radu Timofte, Rasmus Rothe}
顔面ランドマークを用いずに単一画像から実年齢および顕在年齢の深い期待値を推定する
要約

本稿では、顔のランドマークを用いずに単一の顔画像から年齢推定を行うための深層学習手法を提案するとともに、年齢および性別ラベルが付与された顔画像の最大規模の公開データセットであるIMDB-WIKIデータセットを紹介する。実年齢推定の研究は数十年にわたり展開されてきたが、顔画像から他者によって認識される「外見年齢(apparent age)」を推定する研究は、近年になって始まったばかりである。本研究では、ImageNet上で画像分類のため事前学習されたVGG-16アーキテクチャを採用した畳み込みニューラルネットワーク(CNN)を用いて、これらの2つのタスクを同時に扱う。年齢推定問題を深層分類問題として定式化し、その後にソフトマックス期待値の最適化を適用するアプローチを採用している。本手法の鍵となる要素は、大規模データからの深層学習モデルの獲得、頑健な顔画像アライメント、および年齢回帰に向けた期待値定式化である。標準的なベンチマーク上での実験により、実年齢推定および外見年齢推定の両面で、最先端の性能を達成した。