12 天前

基于图引导的MLP-Mixer用于基于骨架的人体运动预测

Xinshun Wang, Qiongjie Cui, Chen Chen, Shen Zhao, Mengyuan Liu
基于图引导的MLP-Mixer用于基于骨架的人体运动预测
摘要

近年来,图卷积网络(Graph Convolutional Networks, GCNs)在人体运动预测任务中得到了广泛应用,但其性能仍不尽如人意。近期,最初为视觉任务设计的MLP-Mixer被引入人体运动预测领域,作为一种有前景的GCN替代方案,其在性能和效率方面均优于传统GCN。与GCN不同,GCN通过将人体骨骼结构建模为包含节点和边的图结构,能够显式捕捉骨骼的骨-关节拓扑关系;而MLP-Mixer依赖全连接层进行信息交互,无法显式建模人体骨骼这种图结构特性。为突破MLP-Mixer在建模图结构方面的局限性,本文提出一种新方法——图引导的MLP-Mixer(Graph-Guided Mixer),该方法在原始MLP-Mixer架构基础上引入图结构引导机制,赋予其建模图结构的能力。通过融合图结构先验信息,所提出的Graph-Guided Mixer能够有效捕捉并利用人体骨骼图表示中的特定连接模式。本文首先揭示了MLP-Mixer与GCN之间尚未被现有研究充分探索的理论关联;基于这一理论联系,进一步提出Graph-Guided Mixer,并详细阐述如何对原始MLP-Mixer架构进行重构,以融入图结构的指导信息。随后,我们在Human3.6M、AMASS和3DPW等多个公开数据集上进行了全面的实验评估,结果表明,所提方法在多项指标上均达到当前最优(state-of-the-art)性能,显著提升了人体运动预测的准确性与鲁棒性。

基于图引导的MLP-Mixer用于基于骨架的人体运动预测 | 最新论文 | HyperAI超神经