8 天前

面向在线人体行为识别的增强时空图像编码

{Pierre De Loor, Marlene Gilles, Alexis Nédélec, Vincent Fer, Nassim Mokhtari}
摘要

基于传感器数据的人体活动识别(Human Activity Recognition, HAR)可被视为一种时间序列分类问题,其核心挑战在于同时捕捉空间与时间依赖性,并聚焦于最具相关性的数据变化特征。本研究采用从RGB+D相机提取的三维骨骼数据(3D skeleton data)进行建模。针对Kinect传感器捕获的3D骨骼数据,本文提出一种改进的时空图像编码方法,该方法引入“运动能量”(motion energy)概念,重点关注在特定动作中参与程度最高的骨骼关节点。通过聚焦动作中最具代表性的部分,该编码方式显著提升了在线活动检测的判别能力。本文详细介绍了这一新型编码方法,并将其应用于基于深度学习的HAR任务中,模型在经编码处理的3D骨骼数据上进行训练。为验证模型性能,我们系统研究了Keras库中多个预训练卷积神经网络(CNN)的迁移学习能力。实验结果表明,所提出方法在分类准确率方面相较现有技术水平取得了显著提升。

面向在线人体行为识别的增强时空图像编码 | 最新论文 | HyperAI超神经