Command Palette
Search for a command to run...
Anomalieerkennung in realen Überwachungsvideos
Anomalieerkennung in realen Überwachungsvideos
Sultani Waqas Chen Chen Shah Mubarak
Zusammenfassung
Überwachungsvideos sind in der Lage, eine Vielzahl realistischer Anomalien zu erfassen. In diesem Paper schlagen wir vor, Anomalien zu lernen, indem sowohl normale als auch anormale Videos genutzt werden. Um die zeitaufwändige Annotation anormaler Segmente oder Clips in Trainingsvideos zu vermeiden, schlagen wir einen Ansatz basierend auf einem tiefen Mehrinstanz-Ranking-Modell vor, das schwach beschriftete Trainingsvideos nutzt – d. h., die Trainingslabels (anomal oder normal) sind auf Video-Ebene, nicht auf Clip-Ebene angegeben. In unserem Ansatz betrachten wir normale und anormale Videos als „Bags“ und Video-Segmente als „Instanzen“ im Rahmen des Mehrinstanz-Lernens (Multiple Instance Learning, MIL). Dadurch wird automatisch ein tiefes Anomalie-Ranking-Modell gelernt, das für anormale Video-Segmente hohe Anomalie-Scores vorhersagt. Zudem führen wir Sparsitäts- und zeitliche Glattheitsbedingungen in die Ranking-Verlustfunktion ein, um die Lokalisierung von Anomalien während des Trainings zu verbessern. Außerdem stellen wir ein neues, großes, bisher einzigartiges Datenset mit insgesamt 128 Stunden Videoinhalten vor. Es umfasst 1900 lange, ungeschnittene Videos aus der realen Welt aus Überwachungssystemen, die 13 realistische Anomalien wie Schlägereien, Verkehrsunfälle, Einbrüche, Raubüberfälle usw. sowie normale Aktivitäten enthalten. Dieses Datenset kann für zwei Aufgaben genutzt werden: Erstens für die allgemeine Anomalieerkennung, bei der alle Anomalien in einer Gruppe und alle normalen Aktivitäten in einer anderen Gruppe zusammengefasst werden; zweitens für die Erkennung jeder einzelnen der 13 anormalen Aktivitäten. Unsere experimentellen Ergebnisse zeigen, dass unser MIL-Ansatz für die Anomalieerkennung eine signifikante Verbesserung der Leistung gegenüber aktuellen state-of-the-art-Methoden erreicht. Wir präsentieren zudem Ergebnisse mehrerer jüngster Deep-Learning-Baselines für die Erkennung anormaler Aktivitäten. Die niedrige Erkennungsleistung dieser Baselines verdeutlicht, dass unser Datenset äußerst herausfordernd ist und zukünftige Forschungsarbeiten neue Möglichkeiten eröffnet. Das Datenset ist unter folgender Adresse verfügbar: https://webpages.uncc.edu/cchen62/dataset.html