17 天前
基于深度学习技术的视频暴力行为识别
{Dina Khattab, Bassel Safwat Chawky, Youssef Mohamed Mostafa, Mina Abd El-Massih Nashed, Mohamed Hussein Kamal, Mohamed Mostafa Soliman}
摘要
视频中个体或群体间暴力行为的自动识别具有广泛的研究兴趣。本文提出了一种端到端的深度神经网络模型,用于视频中的暴力行为识别。该模型首先采用在ImageNet上预训练的VGG-16作为空间特征提取器,随后利用长短期记忆网络(LSTM)提取时间特征,并通过一系列全连接层完成分类任务。实验结果表明,该模型的识别准确率接近当前最先进水平。此外,本文还引入了一个新的基准数据集,命名为“真实生活暴力场景”(Real-Life Violence Situations),该数据集包含2000段短视频,其中1000段为暴力视频,1000段为非暴力视频。利用该新基准对模型进行微调后,取得了最高88.2%的识别准确率。