Vertragsmäßige Skelett-Kinematik für die Anomalieerkennung in menschenbezogenen Videos

Die Erkennung von Anomalien im menschlichen Verhalten ist entscheidend für die frühzeitige Erkennung gefährlicher Situationen, wie beispielsweise Straßenkämpfe oder Stürze älterer Menschen. Die Anomalieerkennung ist jedoch komplex, da anormale Ereignisse selten auftreten und es sich um eine offene Mengenerkennungsaufgabe handelt, d. h., dass das Anomale während der Inferenz nicht während des Trainings beobachtet wurde. Wir stellen COSKAD vor, ein neuartiges Modell, das menschliche Bewegungsskelette mittels eines Graphen-Convolutional Networks kodiert und lernt, kinematische Skelett-Einbettungen auf einer latenten Hypersphäre minimalen Volumens zu kontrahieren, um Anomalien in Videos zu detektieren. Wir schlagen drei latente Räume vor: den üblicherweise verwendeten euklidischen sowie zwei neuartige sphärische und hyperbolische Räume. Alle Varianten übertrumpfen den Stand der Technik auf dem neuesten UBnormal-Datensatz, für den wir eine menschenbezogene Version mit annotierten Skeletten beisteuern. COSKAD erreicht eine neue Soll-der-Technik auf den menschenbezogenen Versionen von ShanghaiTech Campus und CUHK Avenue, wobei die Leistung mit jener von video-basierten Methoden vergleichbar ist. Quellcode und Datensatz werden nach Annahme veröffentlicht.