Command Palette
Search for a command to run...
Fine-Grained Age Estimation in the wild with Attention LSTM Networks
野生環境下での細かい年齢推定にAttention LSTMネットワークを用いる
Fine-Grained Age Estimation in the wild with Attention LSTM Networks 野生環境下での細かい年齢推定にAttention LSTMネットワークを用いる
Ke Zhang, Member, IEEE Na Liu Xingfang Yuan, Student Member, IEEE Xinyao Guo Ce Gao Zhenbing Zhao, Member, IEEE Zhanyu Ma, Senior Member, IEEE
概要
単一の顔画像から年齢を推定することは、ヒューマンコンピュータインタラクションおよびコンピュータビジョン分野において重要な課題であり、実践的な応用価値が広範囲にわたります。既存の方法では、野外環境での顔画像の年齢推定精度は比較的低く、これは全体的な特徴のみを考慮し、年齢感応領域の細かい特徴を無視しているためです。本研究では、細かいカテゴリーと視覚的注意メカニズムに着想を得て、注目長期短期記憶(Attention Long Short-Term Memory: AL)ネットワークに基づく新しい方法を提案します。この方法は、残差ネットワーク(Residual Networks: ResNets)または残差ネットワークの残差ネットワーク(Residual Network of Residual Network: RoR)モデルとLSTMユニットを組み合わせてAL-ResNetsまたはAL-RoRネットワークを構築し、年齢感応領域の局所特徴を抽出することで、効果的に年齢推定精度を向上させます。まず、ImageNetデータセットで事前学習されたResNetsまたはRoRモデルを選択し、IMDB-WIKI-101データセット上で年齢推定のために微調整します。次に、対象となる年齢データセット上でResNetsまたはRoRモデルを微調整して、顔画像の全体的な特徴を抽出します。年齢感応領域の局所特徴を抽出するために、LSTMユニットを使用してこれらの領域の座標を自動的に取得します。最後に、Adienceデータセット上で直接年齢グループ分類を行い、MORPH Album 2, FG-NET, 15/16LAPデータセット上でDeep EXpectationアルゴリズム(DEX)による年齢回帰実験を行います。全体的な特徴と局所的な特徴を組み合わせることで最終的な予測結果を得ます。実験結果は、提案したAL-ResNetsまたはAL-RoRが野外環境での年齢推定において有効性と堅牢性を持つことを示しており、他のすべての畳み込みニューラルネットワークよりも優れた最先端性能を達成しています。