Mehrzeitmaßstab-Trajektorienvorhersage für die Erkennung abnormen menschlichen Verhaltens

Ein klassischer Ansatz zur Erkennung von abnormen Aktivitäten besteht darin, eine Repräsentation für normale Aktivitäten aus den Trainingsdaten zu lernen und diese gelernte Repräsentation dann während des Testens zur Erkennung von abnormen Aktivitäten zu verwenden. Üblicherweise operieren Methoden, die auf diesem Ansatz basieren, zu einem festgelegten Zeitmaßstab – entweder zu einem einzelnen Zeitpunkt (z. B. rahmenbasiert) oder über eine konstante Zeitspanne (z. B. clipbasiert). Allerdings können menschliche abnorme Aktivitäten bei verschiedenen Zeitmaßstäben auftreten. Zum Beispiel ist Springen in einem Überwachungsszenario eine kurzfristige Anomalie, während Herumlungern eine langfristige Anomalie ist. Ein einzelner und vordefinierter Zeitmaßstab reicht nicht aus, um das breite Spektrum von Anomalien mit unterschiedlicher Dauer zu erfassen. In dieser Arbeit schlagen wir ein Modell mit mehreren Zeitmaßstäben vor, um die zeitlichen Dynamiken bei verschiedenen Zeitmaßstäben zu erfassen. Insbesondere macht das vorgeschlagene Modell zukünftige und vergangene Vorhersagen bei verschiedenen Zeitmaßstäben für eine gegebene Eingabe-Pose-Trajektorie. Das Modell ist mehrschichtig, wobei die Zwischenschichten verantwortlich sind, Vorhersagen entsprechend der verschiedenen Zeitmaßstäbe zu generieren. Diese Vorhersagen werden kombiniert, um abnorme Aktivitäten zu erkennen. Darüber hinaus stellen wir einen Datensatz für Forschungszwecke vor, der 483.566 annotierte Frames enthält. Der Datensatz wird unter https://rodrigues-royston.github.io/Multi-timescale_Trajectory_Prediction/ zur Verfügung gestellt. Unsere Experimente zeigen, dass das vorgeschlagene Modell Anomalien verschiedener Dauer erfassen kann und bestehende Methoden übertrifft.