
要約
異なる年齢推定手法を比較することは、ベンチマークプロセスにおける不整合性に起因する公表結果の信頼性の低さにより、困難を伴う。過去10年間、専用手法を用いて継続的な性能向上が報告されてきたが、本研究の結果はこうした主張に疑問を呈する。本論文では、現在用いられている評価プロトコルに存在する、単純ながらも根強く残る二つの問題を特定し、それらの解決法を提示する。さらに、最先端の顔画像年齢推定手法について広範な比較分析を実施した。驚くべきことに、顔のアライメント、顔領域のカバー範囲、画像解像度、モデルアーキテクチャ、あるいは事前学習に用いられたデータ量といった他の要因に比べて、手法間の性能差は極めて小さく、ほとんど無視できる程度であることがわかった。得られた知見をもとに、FaRLをバックボーンモデルとして採用する提案を行い、公開データセットすべてにおいてその有効性を実証した。また、ソースコードおよび正確なデータ分割情報をGitHub上で公開する。