Command Palette
Search for a command to run...
基于注意力机制的LSTM网络在野外进行细粒度年龄估计
基于注意力机制的LSTM网络在野外进行细粒度年龄估计
Ke Zhang, Member, IEEE Na Liu Xingfang Yuan, Student Member, IEEE Xinyao Guo Ce Gao Zhenbing Zhao, Member, IEEE Zhanyu Ma, Senior Member, IEEE
摘要
基于单张面部图像的年龄估计在人机交互和计算机视觉领域是一项重要的任务,具有广泛的实际应用价值。现有的方法在野外环境下的面部图像年龄估计准确性相对较低,因为它们仅考虑了全局特征,而忽视了年龄敏感区域的细粒度特征。我们提出了一种基于注意力长短时记忆(AL)网络的新方法,用于野外环境下的细粒度年龄估计,该方法受到细粒度分类和视觉注意机制的启发。此方法结合了残差网络(ResNets)或残差网络中的残差网络(RoR)模型与LSTM单元,构建了AL-ResNets或AL-RoR网络,以提取年龄敏感区域的局部特征,从而有效提高了年龄估计的准确性。首先,选择在ImageNet数据集上预训练的ResNets或RoR模型作为基础模型,并在IMDB-WIKI-101数据集上进行微调以实现年龄估计。然后,在目标年龄数据集上进一步微调ResNets或RoR模型,以提取面部图像的全局特征。为了提取年龄敏感区域的局部特征,引入LSTM单元自动获取这些区域的坐标。最后,在Adience数据集上直接进行年龄段分类,并通过深度期望算法(Deep EXpectation, DEX)在MORPH Album 2、FG-NET和15/16LAP数据集上进行年龄回归实验。通过结合全局和局部特征,我们得到了最终的预测结果。实验结果表明,所提出的AL-ResNets或AL-RoR方法在野外环境下的年龄估计中表现出色且稳健,其性能优于所有其他卷积神经网络的方法。