Bounding Boxes und probabilistische grafische Modelle: Vereinfachte Videoanomalieerkennung

In dieser Studie formulieren wir die Aufgabe der Videoanomaliedetektion als wahrscheinlichkeitstheoretische Analyse von Objektrahmen (object bounding boxes). Wir gehen davon aus, dass die Darstellung von Objekten ausschließlich durch ihre Rahmungen ausreichend ist, um anomale Ereignisse in einer Szene erfolgreich zu identifizieren. Der implizierte Wert dieses Ansatzes liegt in erhöhter Objektanonymisierung, schnellerem Modelltraining und geringeren Rechenressourcen. Dies kann insbesondere Anwendungen im Bereich der Videosurveillance auf Edge-Geräten wie Kameras zugutekommen. Unser Modell basiert auf menschlichem Denken, was es ermöglicht, die Modellausgabe in menschlich verständlichen Begriffen zu erklären. Gleichzeitig trainiert das langsamste Modell in weniger als 7 Sekunden auf einem Intel Core i9-Processor der 11. Generation. Obwohl unser Ansatz eine drastische Reduktion des Problemspektrums im Vergleich zu früheren Arbeiten darstellt, zeigen wir, dass dies nicht mit einer Leistungsabnahme einhergeht: Die von uns gemeldeten Ergebnisse sind auf den Benchmark-Datensätzen CUHK Avenue und ShanghaiTech hochwettbewerbsfähig und übertreffen die neuesten Stand-der-Technik-Ergebnisse auf StreetScene erheblich, was bisher als der anspruchsvollste Datensatz für Videoanomaliedetektion gilt.