EVAL: Erklärbare Lokalisierung von Anomalien in Videos

Wir entwickeln einen neuartigen Rahmen für die Anomalie-Localisierung in Einzelszenen-Videos, der menschlich verständliche Erklärungen für die Entscheidungen des Systems ermöglicht. Zunächst lernen wir allgemeine Darstellungen von Objekten und deren Bewegungen (unter Verwendung tiefer Netzwerke) und nutzen diese Darstellungen anschließend, um ein hochwertiges, ortsspezifisches Modell einer beliebigen Szene aufzubauen. Dieses Modell kann dann zur Erkennung von Anomalien in neuen Videos derselben Szene eingesetzt werden. Wichtig ist, dass unser Ansatz erklärbare Ergebnisse liefert – unsere hochwertigen Merkmale für Erscheinungsbild und Bewegung können menschlich verständliche Gründe dafür liefern, warum ein bestimmter Bereich eines Videos als normal oder anomalous klassifiziert wird. Wir führen Experimente auf Standard-Datensätzen für die Anomalieerkennung in Videos (Street Scene, CUHK Avenue, ShanghaiTech und UCSD Ped1, Ped2) durch und zeigen signifikante Verbesserungen gegenüber dem bisherigen Stand der Technik.