Ganzheitliche Repräsentationslernverfahren für mehrfachaufgabenbasierte Anomalieerkennung in Trajektorien

Die Video-Anomalieerkennung befasst sich mit der Erkennung ungewöhnlicher Ereignisse in Videos. Neben dem visuellen Signal wurde die Anomalieerkennung in Videos auch anhand von Skelettsequenzen untersucht. Wir schlagen eine ganzheitliche Darstellung von Skeletttrajektorien vor, um erwartete Bewegungen über verschiedene Zeitsegmente hinweg zu lernen. Unser Ansatz nutzt Multitask-Lernen, um beliebige kontinuierliche, nicht beobachtete zeitliche Segmente der Trajektorie zu rekonstruieren, wodurch die Extrapolation vergangener oder zukünftiger Segmente sowie die Interpolation zwischen diesen Segmenten möglich wird. Wir verwenden einen end-to-end-ansatzbasierten Encoder-Decoder mit Aufmerksamkeit. Dabei werden zeitlich abgedeckte Trajektorien kodiert, gemeinsam latente Darstellungen der abgedeckten Segmente gelernt und die Trajektorien basierend auf erwarteten Bewegungen über verschiedene zeitliche Segmente hinweg rekonstruiert. Umfangreiche Experimente auf drei auf Trajektorien basierenden Datensätzen zur Video-Anomalieerkennung zeigen die Vorteile und Wirksamkeit unseres Ansatzes mit state-of-the-art-Ergebnissen bei der Anomalieerkennung in Skeletttrajektorien.