
摘要
基于3D骨架数据的人体动作识别近年来因其简洁性、鲁棒性和视角不变性表示而受到广泛关注。近期针对这一问题的研究建议开发基于RNN的学习方法,以建模时间域中的上下文依赖关系。在本文中,我们将这一思路扩展到时空域,同时分析输入数据在这两个域中的动作相关信息的隐含来源。受人体骨架图结构的启发,我们进一步提出了一种更为强大的基于树结构的遍历方法。为了处理3D骨架数据中的噪声和遮挡问题,我们在LSTM中引入了新的门控机制,以学习序列输入数据的可靠性,并相应地调整其对存储在记忆单元中的长期上下文信息更新的影响。我们的方法在4个具有挑战性的基准数据集上实现了最先进的性能,用于3D人体动作分析。