6 个月前

计算机视觉

卷积神经网络

计算机视觉

Hanqing Lu Jian Cheng Weihan Chen Xiangyu He Yifan Zhang Ke Cheng

摘要

基于骨骼数据的动作识别在计算机视觉领域正受到越来越多的关注。近年来，图卷积网络（Graph Convolutional Networks, GCNs）通过将人体骨骼建模为时空图，取得了显著的性能提升。然而，基于GCN的方法计算复杂度较高，单个动作样本的计算量通常超过15 GFLOPs，部分最新方法甚至达到约100 GFLOPs。此外，空间图与时间图的感受野均存在灵活性不足的问题。尽管一些工作通过引入增量自适应模块增强了空间图的表达能力，但其性能仍受限于传统的GCN结构。为此，本文提出一种新型的移位图卷积网络（Shift Graph Convolutional Network, Shift-GCN），以同时解决上述两个问题。与依赖复杂常规图卷积不同，Shift-GCN由新颖的移位图操作和轻量级逐点卷积构成，其中移位图操作为时空图提供了灵活的感受野。在三个基于骨骼的动作识别数据集上的实验结果表明，所提出的Shift-GCN在性能上显著超越现有最先进方法，同时计算复杂度降低超过10倍。

源 PDF 查看代码

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

6 个月前

计算机视觉

卷积神经网络

计算机视觉

Hanqing Lu Jian Cheng Weihan Chen Xiangyu He Yifan Zhang Ke Cheng

摘要

基于骨骼数据的动作识别在计算机视觉领域正受到越来越多的关注。近年来，图卷积网络（Graph Convolutional Networks, GCNs）通过将人体骨骼建模为时空图，取得了显著的性能提升。然而，基于GCN的方法计算复杂度较高，单个动作样本的计算量通常超过15 GFLOPs，部分最新方法甚至达到约100 GFLOPs。此外，空间图与时间图的感受野均存在灵活性不足的问题。尽管一些工作通过引入增量自适应模块增强了空间图的表达能力，但其性能仍受限于传统的GCN结构。为此，本文提出一种新型的移位图卷积网络（Shift Graph Convolutional Network, Shift-GCN），以同时解决上述两个问题。与依赖复杂常规图卷积不同，Shift-GCN由新颖的移位图操作和轻量级逐点卷积构成，其中移位图操作为时空图提供了灵活的感受野。在三个基于骨骼的动作识别数据集上的实验结果表明，所提出的Shift-GCN在性能上显著超越现有最先进方法，同时计算复杂度降低超过10倍。

源 PDF 查看代码

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供