2 个月前

DeepGRU:深度手势识别工具

Mehran Maghoumi; Joseph J. LaViola Jr
DeepGRU:深度手势识别工具
摘要

我们提出了一种名为DeepGRU的新颖端到端深度网络模型,该模型借鉴了近期在手势和动作识别领域的深度学习进展,具有简洁性和设备无关性。DeepGRU仅使用原始骨骼、姿态或向量数据,易于理解和实现,并且训练速度快,同时在具有挑战性的数据集上取得了最先进的结果。我们的方法核心在于一组堆叠的门控循环单元(GRU)、两个全连接层以及一种新颖的全局注意力模型。我们在七个公开可用的数据集上评估了该方法,这些数据集包含不同数量的样本,并涵盖了广泛的人体交互类型(全身、多演员、手势等)。除了一个案例外,我们在所有其他情况下均超越了基于姿态的最先进方法。例如,在NTU RGB+D数据集的跨主体和跨视角测试中,我们分别达到了84.9%和92.3%的识别准确率;在UT-Kinect数据集中,我们也实现了100%的识别准确率。尽管DeepGRU在大型数据集上有很好的表现,但我们还展示了即使在没有大量训练样本的情况下,每个类别仅有四个样本时,DeepGRU仍能胜过专门为小规模训练集设计的传统方法。最后,我们证明了即使没有强大的硬件支持,仅使用CPU,在小型数据集上也能在不到10分钟的时间内完成训练,这使得它成为快速应用原型设计和开发的一个有吸引力的选择。

DeepGRU:深度手势识别工具 | 最新论文 | HyperAI超神经