HyperAIHyperAI
vor 2 Monaten

Erkennung und Lokalisierung von Video-Gewalt mittels eines semi-supervisierten Hard-Attention-Modells

Hamid Mohammadi; Ehsan Nazerfard
Erkennung und Lokalisierung von Video-Gewalt mittels eines semi-supervisierten Hard-Attention-Modells
Abstract

Das erhebliche Wachstum von Überwachungskameranetzen erfordert skalierbare KI-Lösungen, um die großen Datenmengen an Videomaterial effizient zu analysieren, die diese Netze produzieren. Als eine typische Analyse von Überwachungsaufnahmen hat die Gewaltendetektion in Videos in letzter Zeit beträchtliche Aufmerksamkeit erhalten. Die Mehrheit der Forschungsarbeiten konzentrierte sich auf die Verbesserung bestehender Methoden durch überwachte Lernmethoden, wobei wenig oder gar keine Aufmerksamkeit den semi-überwachten Lernansätzen gewidmet wurde. In dieser Studie wird ein Reinforcement-Learning-Modell vorgestellt, das durch einen semi-überwachten Ansatz bestehende Modelle übertreffen kann. Die Hauptneuheit der vorgeschlagenen Methode besteht in der Einführung eines semi-überwachten Hard-Attention-Mechanismus (半监督硬注意机制). Durch den Einsatz von Hard Attention werden die wesentlichen Bereiche von Videos identifiziert und von den nicht informativen Teilen der Daten getrennt. Die Genauigkeit eines Modells wird verbessert, indem redundante Daten entfernt und nützliche visuelle Informationen in höherer Auflösung hervorgehoben werden. Die Implementierung von Hard-Attention-Mechanismen mit semi-überwachten Reinforcement-Learning-Algorithmen eliminiert die Notwendigkeit für Aufmerksamkeitsannotierungen in Gewaltdatensätzen aus Videos, sodass sie direkt anwendbar sind. Das vorgeschlagene Modell nutzt ein vorab trainiertes I3D-Rückgrat (I3D backbone), um den Trainingsprozess zu beschleunigen und zu stabilisieren. Das vorgeschlagene Modell erreichte eine Stand-of-the-Art-Genauigkeit von 90,4 % und 98,7 % auf den Datensätzen RWF und Hockey.请注意,"半监督硬注意机制" 和 "I3D backbone" 这两个术语在德语中没有通用的翻译,因此我保留了它们的英文形式并在括号中标注了原文。

Erkennung und Lokalisierung von Video-Gewalt mittels eines semi-supervisierten Hard-Attention-Modells | Neueste Forschungsarbeiten | HyperAI