Command Palette
Search for a command to run...
深層RoRアーキテクチャを用いたワイルド環境下における年齢層および性別推定
深層RoRアーキテクチャを用いたワイルド環境下における年齢層および性別推定
概要
制約のない環境下で取得された顔画像から年齢層および性別の自動予測は、多くの実世界応用において重要かつ挑戦的な課題である。しかし、従来の手動で設計された特徴量を用いた手法は、制約のない画像における大きな変動に対処する能力に欠けるため、野外データセット(in-the-wild benchmarks)において満足のいく結果を示せていない。この課題は、強力な特徴表現能力を有する畳み込みニューラルネットワーク(Convolutional Neural Networks: CNN)の導入により、ある程度緩和された。本論文では、年齢層および性別分類において他のCNNアーキテクチャよりも優れた最適化能力を示す「リジッドネットワークのリジッドネットワーク」(Residual Networks of Residual Networks: RoR)を活用した新しいCNNベースの年齢層・性別推定手法を提案する。さらに、年齢層の特性を観察した上で導入された2つの簡素な機構により、年齢推定性能をさらに向上させた。性能のさらなる向上および過学習の緩和を図るため、RoRモデルはまずImageNet上で事前学習を行い、その後IMDB-WIKI-101データセットで微調整(fine-tuning)により顔画像の特徴をさらに学習した。最後に、Adienceデータセットで再び微調整を行い、最終的な推定モデルを構築した。実験の結果、本手法は野外環境下における年齢および性別の推定において、他のCNN手法と比較して優れた性能を示した。特に、2つの提案機構を組み合わせたRoR-152+IMDB-WIKI-101は、Adienceベンチマークにおいて新たな最先端(state-of-the-art)の成果を達成した。