2 个月前
基于深度RoR架构的野外年龄组和性别估计
Zhang, Ke ; Gao, Ce ; Guo, Liru ; Sun, Miao ; Yuan, Xingfang ; Han, Tony X. ; Zhao, Zhenbing ; Li, Baogang

摘要
在许多实际应用中,从无约束条件下获取的人脸图像自动预测年龄组和性别是一项重要且具有挑战性的任务。然而,传统的基于手工设计特征的方法在野外基准测试中的表现不尽如人意,因为它们无法有效应对无约束图像中的巨大变化。通过卷积神经网络(CNN)的强大特征表示能力,这一难题在一定程度上得到了缓解。本文提出了一种新的基于CNN的年龄组和性别估计方法,该方法利用了残差网络的残差网络(RoR),其在年龄组和性别分类方面的优化能力优于其他CNN架构。此外,我们还提出了两种基于年龄组特征观察的机制,以进一步提高年龄估计的性能。为了进一步提升性能并缓解过拟合问题,首先在ImageNet数据集上对RoR模型进行预训练,然后在IMDB-WIKI-101数据集上进行微调以学习人脸图像的特征,最后再在Adience数据集上进行微调。实验结果表明,RoR方法在野外环境中进行年龄和性别估计的有效性,在性能方面优于其他CNN方法。最终,结合两种机制的RoR-152+IMDB-WIKI-101模型在Adience基准测试中取得了最新的最佳结果。