HyperAIHyperAI
vor 2 Monaten

MULDE: Mehrskalige Log-Dichte-Schätzung durch Rauschunterdrückung per Score-Matching für die Anomalieerkennung in Videos

Micorek, Jakub ; Possegger, Horst ; Narnhofer, Dominik ; Bischof, Horst ; Kozinski, Mateusz
MULDE: Mehrskalige Log-Dichte-Schätzung durch Rauschunterdrückung per Score-Matching für die Anomalieerkennung in Videos
Abstract

Wir schlagen einen neuen Ansatz zur Videoanomalieerkennung vor: Wir behandeln die aus Videos extrahierten Merkmalsvektoren als Realisierungen einer Zufallsvariablen mit einer festen Verteilung und modellieren diese Verteilung mit einem neuronalen Netzwerk. Dies ermöglicht es uns, die Wahrscheinlichkeit von Testvideos zu schätzen und Videoanomalien durch Schwellwertbildung der Wahrscheinlichkeitsabschätzungen zu erkennen. Wir trainieren unseren Videoanomaliedetektor unter Verwendung einer Modifikation des Denoising Score Matching (DSM), einer Methode, die das Training durch Hinzufügen von Rauschen zu den Trainingsdaten erleichtert, um deren Verteilung besser modellieren zu können. Um die Auswahl von Hyperparametern zu eliminieren, modellieren wir die Verteilung der rauschigen Videomerkmale über einen Bereich verschiedener Rauschpegel und führen einen Regularisierer ein, der dazu neigt, die Modelle für verschiedene Rauschpegel auszurichten. Bei der Testphase kombinieren wir Anomalieindikatoren bei mehreren Rauschskalen mit einem Gauß-Mischmodell (Gaussian Mixture Model). Der Betrieb unseres Videoanomaliedetektors verursacht minimale Verzögerungen, da die Inferenz lediglich das Extrahieren der Merkmale und ihre Vorwärtspropagation durch ein flaches neuronales Netzwerk und ein Gauß-Mischmodell erfordert. Unsere Experimente an fünf gängigen Benchmarks für Videoanomalieerkennung zeigen eine Spitzenleistung sowohl im objektzentrierten als auch im rahmencentrierten Szenario.

MULDE: Mehrskalige Log-Dichte-Schätzung durch Rauschunterdrückung per Score-Matching für die Anomalieerkennung in Videos | Neueste Forschungsarbeiten | HyperAI