3 个月前

Bubblenet:一种用于识别活动的分散循环结构

{William R. Schwartz, Victor H. C. Melo, Igor L. O. Bastos}
Bubblenet:一种用于识别活动的分散循环结构
摘要

本文提出了一种基于深度循环网络的人体动作识别方法,该方法以视频的外观特征和光流信息作为输入。所提出的方法设计了一种名为BubbleNET的新架构,其核心结构为将循环层分解为多个模块(称为“气泡”),并引入基于挤压-激励(squeeze-and-excitation)策略的注意力机制,用于动态调节各“气泡”模块的贡献权重。该设计旨在从输入数据中捕捉本质上相关的时间片段信息,从而构建出能够表征各类动作的特征组合模式。在多个广泛使用的动作识别数据集上开展的实验验证了此类特征模式的存在,其表现可通过各类别对应的“气泡激活图”得以直观体现。为与现有文献方法进行对比,本文采用平均准确率作为评价指标,结果显示,BubbleNET在UCF-101、YUP++和HMDB-51数据集上的准确率分别为97.62%、91.70%和82.60%,性能处于当前先进水平。