HyperAIHyperAI
vor 17 Tagen

Erkennung von Gewalt in Videos mittels Deep Learning-Techniken

{Dina Khattab, Bassel Safwat Chawky, Youssef Mohamed Mostafa, Mina Abd El-Massih Nashed, Mohamed Hussein Kamal, Mohamed Mostafa Soliman}
Abstract

Die automatische Erkennung von Gewalt zwischen Einzelpersonen oder Gruppen in Videos genießt großes Interesse. In dieser Arbeit wird ein end-to-end-Deep-Neural-Network-Modell zur Erkennung von Gewalt in Videos vorgestellt. Das vorgeschlagene Modell nutzt einen vorab auf ImageNet trainierten VGG-16 als räumlichen Merkmalsextraktor, gefolgt von einem Long Short-Term Memory (LSTM)-Netzwerk als zeitlichen Merkmalsextraktor und einer Folge vollständig verbundener Schichten zur Klassifikation. Die erzielte Genauigkeit liegt nahe der aktuellen State-of-the-Art-Leistung. Zudem tragen wir mit der Einführung einer neuen Benchmark namens Real-Life Violence Situations bei, die aus 2000 kurzen Videos besteht, aufgeteilt in 1000 Gewalt- und 1000 Nicht-Gewalt-Videos. Diese neue Benchmark wird zur Feinabstimmung der vorgeschlagenen Modelle eingesetzt und erreicht eine Höchstgenauigkeit von 88,2 %.