HyperAIHyperAI

Command Palette

Search for a command to run...

基于空间和时间变换器的3D人体姿态估计

Ce Zheng Sijie Zhu Matias Mendieta Taojiannan Yang Chen Chen Zhengming Ding

摘要

Transformer 架构已成为自然语言处理领域的首选模型,并且现在正被引入到计算机视觉任务中,如图像分类、目标检测和语义分割。然而,在人体姿态估计领域,卷积架构仍然占据主导地位。在本研究中,我们提出了PoseFormer,这是一种完全基于 Transformer 的方法,用于视频中的3D人体姿态估计,而不涉及卷积架构。受到近期视觉 Transformer 发展的启发,我们设计了一种时空 Transformer 结构,以全面建模每帧内的人体关节关系以及跨帧的时间相关性,从而输出中心帧的精确3D人体姿态。我们对我们的方法在两个流行的标准基准数据集上进行了定量和定性的评估:Human3.6M和MPI-INF-3DHP。大量实验表明,PoseFormer在这两个数据集上均达到了最先进的性能。代码可在以下网址获取:https://github.com/zczcwh/PoseFormer


用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码
开箱即用的 GPU
最优定价

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供