HyperAIHyperAI
vor 2 Monaten

Ein framework, das unabhängig vom Hintergrund mit adversarieller Trainierung für die Erkennung von abnormen Ereignissen in Videos ist.

Georgescu, Mariana-Iuliana ; Ionescu, Radu Tudor ; Khan, Fahad Shahbaz ; Popescu, Marius ; Shah, Mubarak
Ein framework, das unabhängig vom Hintergrund mit adversarieller Trainierung für die Erkennung von abnormen Ereignissen in Videos ist.
Abstract

Die Erkennung von abnormen Ereignissen in Videos ist ein komplexes Problem der Computer Vision, das in den letzten Jahren erhebliche Aufmerksamkeit gefunden hat. Die Komplexität dieser Aufgabe resultiert aus der üblichen Definition eines abnormen Ereignisses, nämlich einem selten auftretenden Ereignis, das in der Regel vom umgebenden Kontext abhängt. Indem wir uns an die Standardformulierung der Erkennung abnormer Ereignisse als Ausreißererkennung halten, schlagen wir einen Hintergrund-unabhängigen Rahmen vor, der sich anhand von Trainingsvideos mit ausschließlich normalen Ereignissen weiterentwickelt. Unser Rahmen besteht aus einem Objekterkennungsmodul, einer Reihe von Erscheinungs- und Bewegungs-Autoencodern sowie einer Reihe von Klassifikatoren. Da unser Rahmen nur Objekterkennungen betrachtet, kann er auf verschiedene Szenarien angewendet werden, vorausgesetzt, normale Ereignisse sind innerhalb aller Szenarien identisch definiert und der einzige Hauptfaktor der Variation ist der Hintergrund.Um das Fehlen abnormer Daten während des Trainings zu überwinden, schlagen wir eine feindliche Lernstrategie für die Autoencoder vor. Wir erstellen eine szenario-unabhängige Menge von außerhalb des Domänenbereichs liegenden Pseudo-abnormalen Beispielen, die von den Autoencodern korrekt rekonstruiert werden, bevor Gradientenaufstieg auf den Pseudo-abnormalen Beispielen durchgeführt wird. Wir nutzen diese Pseudo-abnormalen Beispiele ferner als abnorme Beispiele beim Training von erscheinungs- und bewegungsbasierten binären Klassifikatoren zur Unterscheidung zwischen normalen und abnormen latente Merkmalen und Rekonstruktionen.Wir vergleichen unseren Rahmen mit den Stand-of-the-Art-Methoden auf vier Benchmark-Datensätzen unter Verwendung verschiedener Evaluationsmetriken. Empirische Ergebnisse zeigen im Vergleich zu bestehenden Methoden eine günstige Leistung unseres Ansatzes auf allen Datensätzen. Darüber hinaus stellen wir regions- und spurbasierte Annotationen für zwei große abnorme Ereigniserkennungsdatensätze aus der Literatur bereit: ShanghaiTech und Subway (U-Bahn).