2ヶ月前
野生環境下での年齢層と性別の推定に深層RoRアーキテクチャを用いる
Zhang, Ke ; Gao, Ce ; Guo, Liru ; Sun, Miao ; Yuan, Xingfang ; Han, Tony X. ; Zhao, Zhenbing ; Li, Baogang

要約
非制約条件下で取得された顔画像から年齢層と性別を自動的に予測することは、多くの実世界のアプリケーションにおいて重要な課題であり、また挑戦的なタスクです。しかしながら、非制約条件の画像における大きな変動に対処する能力に欠けるため、従来の手法では手動で設計された特徴量を使用した野外ベンチマークでの結果は満足いくものではありません。この困難は、強力な特徴表現能力を持つ畳み込みニューラルネットワーク(CNN)を通じて一定程度緩和されています。本論文では、年齢層と性別の推定に残差ネットワークの残差ネットワーク(Residual Networks of Residual Networks: RoR)を活用した新しいCNNベースの手法を提案します。この手法は他のCNNアーキテクチャよりも年齢層と性別分類において優れた最適化能力を示しています。さらに、年齢層の特性に基づく観察から導き出された2つの簡易メカニズムが提示され、これにより年齢推定の性能が更に向上します。性能向上と過学習問題の軽減のために、まずRoRモデルはImageNet上で事前学習され、次にIMDB-WIKI-101データセット上で顔画像の特徴をより深く学習するために微調整されます。最後に、Adienceデータセット上で微調整が行われます。我々の実験結果は、野外環境における年齢と性別の推定においてRoR手法の有効性を示しており、他のCNN手法よりも優れた性能を達成しています。最終的に、2つのメカニズムを組み込んだRoR-152+IMDB-WIKI-101はAdienceベンチマークで新たな最先端の結果を達成しました。