HyperAIHyperAI

Command Palette

Search for a command to run...

Fine-Grained Age Estimation in the wild with Attention LSTM Networks 野生環境下での細かい年齢推定にAttention LSTMネットワークを用いる

Ke Zhang, Member, IEEE Na Liu Xingfang Yuan, Student Member, IEEE Xinyao Guo Ce Gao Zhenbing Zhao, Member, IEEE Zhanyu Ma, Senior Member, IEEE

概要

単一の顔画像から年齢を推定することは、ヒューマンコンピュータインタラクションおよびコンピュータビジョン分野において重要な課題であり、実践的な応用価値が広範囲にわたります。既存の方法では、野外環境での顔画像の年齢推定精度は比較的低く、これは全体的な特徴のみを考慮し、年齢感応領域の細かい特徴を無視しているためです。本研究では、細かいカテゴリーと視覚的注意メカニズムに着想を得て、注目長期短期記憶(Attention Long Short-Term Memory: AL)ネットワークに基づく新しい方法を提案します。この方法は、残差ネットワーク(Residual Networks: ResNets)または残差ネットワークの残差ネットワーク(Residual Network of Residual Network: RoR)モデルとLSTMユニットを組み合わせてAL-ResNetsまたはAL-RoRネットワークを構築し、年齢感応領域の局所特徴を抽出することで、効果的に年齢推定精度を向上させます。まず、ImageNetデータセットで事前学習されたResNetsまたはRoRモデルを選択し、IMDB-WIKI-101データセット上で年齢推定のために微調整します。次に、対象となる年齢データセット上でResNetsまたはRoRモデルを微調整して、顔画像の全体的な特徴を抽出します。年齢感応領域の局所特徴を抽出するために、LSTMユニットを使用してこれらの領域の座標を自動的に取得します。最後に、Adienceデータセット上で直接年齢グループ分類を行い、MORPH Album 2, FG-NET, 15/16LAPデータセット上でDeep EXpectationアルゴリズム(DEX)による年齢回帰実験を行います。全体的な特徴と局所的な特徴を組み合わせることで最終的な予測結果を得ます。実験結果は、提案したAL-ResNetsまたはAL-RoRが野外環境での年齢推定において有効性と堅牢性を持つことを示しており、他のすべての畳み込みニューラルネットワークよりも優れた最先端性能を達成しています。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています