18 天前

基于深度的多特征融合动作识别

{Wenbin Chen, Guodong Guo, Yu Zhu}
摘要

人体动作识别是计算机视觉与模式识别领域一个活跃的研究课题。近年来,随着新兴的RGB-D传感器的出现,利用三维(3D)深度数据进行人体动作识别展现出巨大潜力。为此,研究者们提出了多种基于深度信息的特征和/或算法。然而,一个关键问题随之产生:我们是否能够发现一些具有互补性的特征,并将其有效融合,从而显著提升基于深度数据的动作识别准确率?为回答这一问题并更深入地理解该任务的本质,本文系统研究了不同特征在基于深度视频的动作识别中的融合策略。尽管数据融合在其他领域已取得显著成功,但在三维动作识别任务中仍缺乏充分研究。当前仍存在若干亟待解决的问题,例如:特征融合是否确实有助于提升基于深度的动作识别性能?以及应采用何种合理的融合方式?针对这些问题,本文全面探讨了多种融合方案,采用多种不同特征对深度视频中的动作模式进行表征。研究分别从特征级融合与决策级融合两个层次展开,并在每一层次下探索了多种具体方法。本文共考虑了四种具有不同表征能力的特征,从多个角度刻画深度动作模式。为评估并筛选出最优的融合方法,实验在四个具有挑战性的深度动作数据库上进行。实验结果表明,本文所研究的四种特征具有良好的互补性,合理设计的融合策略能够显著提升识别准确率,优于任一单一特征的表现。更为重要的是,本文提出的基于融合的动作风格识别方法,在上述多个具有挑战性的数据集上均超越了现有最先进的技术水平。