Lernen von Regelmäßigkeiten in Skelett-Trajektorien für die Anomalieerkennung in Videos

Erscheinungsmerkmale werden trotz ihrer komplexen, verflochtenen Faktoren weitgehend in der Videoanomalieerkennung eingesetzt. Wir schlagen eine neue Methode vor, um normale Bewegungsmuster von Menschen in Überwachungsvideos zur Anomalieerkennung mit Hilfe dynamischer Skelettfunktionen zu modellieren. Wir zerlegen die skelettalen Bewegungen in zwei Unterkomponenten: globale Körperbewegungen und lokale Körperform. In unserem neuartigen Message-Passing Encoder-Decoder Rekurrenten Netzwerk modellieren wir die Dynamik und Interaktion der gekoppelten Merkmale. Wir beobachteten, dass die entkoppelten Merkmale in unserem räumlich-zeitlichen Modell kollaborativ interagieren, um menschliche Irregularitäten aus Überwachungsvideosequenzen präzise zu identifizieren. Im Vergleich zu traditionellen Erscheinungsmerkmals-basierten Modellen erzielt unsere Methode eine überlegene Ausreißererkennungsleistung. Unser Modell ermöglicht zudem eine "offene Box"-Prüfung und Entscheidungserklärungen durch semantisch verständliche Merkmale und eine Netzwerkarchitektur, die Interpretierbarkeit unterstützt.