6 个月前

计算机视觉

卷积神经网络

计算机视觉

and John Collomosse Matthew Trumble Charles Malleson Adrian Hilton Andrew Gilbert

摘要

我们提出一种算法，用于融合多视角视频（Multi-Viewpoint Video, MVV）与惯性测量单元（Inertial Measurement Unit, IMU）传感器数据，以精确估计三维人体姿态。该算法采用三维卷积神经网络（3-D Convolutional Neural Network），从由MVV帧生成的体素化概率视觉外壳数据（Probabilistic Visual Hull, PVH）中学习姿态嵌入表示。我们将该模型嵌入到一个双流网络架构中，该架构融合了来自MVV的姿态嵌入以及基于IMU数据的前向运动学解算结果。在两路特征融合之前，分别在每条流中引入了时间建模模块（LSTM），以捕捉时序动态特性。实验表明，通过融合这两种互补的数据源进行混合姿态推断，能够有效消除单一传感器模态中的歧义性，显著提升姿态估计的准确性，优于以往方法。本工作的另一重要贡献是构建了一个新的混合式MVV数据集——TotalCapture，该数据集包含视频序列、IMU数据以及由商用动作捕捉系统生成的骨骼关节真值标注。该数据集已公开发布，可在线访问：http://cvssp.org/data/totalcapture/

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

6 个月前

计算机视觉

卷积神经网络

计算机视觉

and John Collomosse Matthew Trumble Charles Malleson Adrian Hilton Andrew Gilbert

摘要

我们提出一种算法，用于融合多视角视频（Multi-Viewpoint Video, MVV）与惯性测量单元（Inertial Measurement Unit, IMU）传感器数据，以精确估计三维人体姿态。该算法采用三维卷积神经网络（3-D Convolutional Neural Network），从由MVV帧生成的体素化概率视觉外壳数据（Probabilistic Visual Hull, PVH）中学习姿态嵌入表示。我们将该模型嵌入到一个双流网络架构中，该架构融合了来自MVV的姿态嵌入以及基于IMU数据的前向运动学解算结果。在两路特征融合之前，分别在每条流中引入了时间建模模块（LSTM），以捕捉时序动态特性。实验表明，通过融合这两种互补的数据源进行混合姿态推断，能够有效消除单一传感器模态中的歧义性，显著提升姿态估计的准确性，优于以往方法。本工作的另一重要贡献是构建了一个新的混合式MVV数据集——TotalCapture，该数据集包含视频序列、IMU数据以及由商用动作捕捉系统生成的骨骼关节真值标注。该数据集已公开发布，可在线访问：http://cvssp.org/data/totalcapture/

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供