17日前

CNNおよびLSTMを用いた動画におけるロバストなリアルタイム暴力検出

{Rana F. Al-Tuma, almamon rasool abdali}
要約

監視システムにおける暴力行為の検出は、法執行機関および都市の安全確保において重要な役割を果たしている。暴力行為検出器の有効性は、応答速度、検出精度、および異なる形式の動画ソースに対しての汎用性によって評価される。これまでの多数の研究では、速度または精度、あるいはその両方に焦点を当てたものがあるが、異なる種類の動画ソースに対する汎用性については十分に考慮されていなかった。本稿では、深層学習を活用したリアルタイムの暴力行為検出モデルを提案する。提案モデルは、空間的特徴抽出にCNN(畳み込みニューラルネットワーク)を、時系列的関係学習にLSTM(長短期記憶)を用いる構成となっており、全体的な汎用性、精度、応答速度の3つの要因に重点を置いている。実験の結果、本モデルは98%の精度を達成し、1秒間に131フレームの処理速度を実現した。既存の研究と比較した結果、本モデルは暴力行為検出分野におけるこれまでのあらゆる手法と比べて、最も高い精度と最も速い処理速度を実現していることが示された。

CNNおよびLSTMを用いた動画におけるロバストなリアルタイム暴力検出 | 最新論文 | HyperAI超神経