HyperAIHyperAI
vor 12 Tagen

Rolling Rotations zur Erkennung menschlicher Aktionen aus 3D-Gelenkdaten

{Rama Chellappa, Raviteja Vemulapalli}
Rolling Rotations zur Erkennung menschlicher Aktionen aus 3D-Gelenkdaten
Abstract

In jüngster Zeit genießt die auf Skelett-Daten basierende Aktionserkennung aufgrund der Verfügbarkeit von Tiefensensoren und Echtzeit-Algorithmen zur 3D-Skelett-Schätzung aus Tiefendaten erhebliche Aufmerksamkeit verschiedener Forschungsgemeinschaften. In dieser Arbeit verwenden wir Rolling Maps zur Erkennung menschlicher Aktionen aus 3D-Skelett-Daten. Die Rolling Map ist ein präzise definiertes mathematisches Konzept, das von der Computer-Vision-Community bisher kaum erforscht wurde. Zunächst repräsentieren wir jedes Skelett durch die relativen 3D-Drehungen zwischen den verschiedenen Körperteilen. Da 3D-Drehungen Elemente der speziellen orthogonalen Gruppe SO(3) sind, wird unsere Skelett-Repräsentation zu einem Punkt in der Lie-Gruppe SO(3) × ... × SO(3), die gleichzeitig eine Riemannsche Mannigfaltigkeit darstellt. Anschließend modellieren wir menschliche Aktionen als Kurven in dieser Lie-Gruppe. Da die Klassifikation von Kurven in diesem nicht-euklidischen Raum eine schwierige Aufgabe darstellt, entfalten wir (unroll) die Aktionenkurven mittels Kombination der Logarithmus-Abbildung mit Rolling Maps auf die Lie-Algebra so(3) × ... × so(3) (die ein Vektorraum ist) und führen die Klassifikation in der Lie-Algebra durch. Experimentelle Ergebnisse auf drei Aktionssammlungen zeigen, dass der vorgeschlagene Ansatz im Vergleich zu aktuellen State-of-the-Art-Verfahren gleich gut oder sogar besser abschneidet.

Rolling Rotations zur Erkennung menschlicher Aktionen aus 3D-Gelenkdaten | Neueste Forschungsarbeiten | HyperAI