Command Palette
Search for a command to run...
Raum-Zeit-Grafen-Convolutional-Netzwerke für die Aktionserkennung basierend auf Skelettdaten
Raum-Zeit-Grafen-Convolutional-Netzwerke für die Aktionserkennung basierend auf Skelettdaten
Yan Sijie Xiong Yuanjun Lin Dahua
Zusammenfassung
Die Dynamik menschlicher Skelette enthält wesentliche Informationen für die Erkennung menschlicher Aktionen. Herkömmliche Ansätze zur Modellierung von Skeletten basieren meist auf handgezeichneten Teilen oder Durchlaufregeln, was zu einer begrenzten Ausdruckskraft und Schwierigkeiten bei der Verallgemeinerbarkeit führt. In dieser Arbeit stellen wir ein neuartiges Modell dynamischer Skelette vor, genannt Spatial-Temporal Graph Convolutional Networks (ST-GCN), das die Beschränkungen früherer Methoden überwindet, indem es sowohl räumliche als auch zeitliche Muster automatisch aus Daten lernt. Diese Formulierung führt nicht nur zu einer höheren Ausdruckskraft, sondern auch zu einer stärkeren Generalisierungsfähigkeit. Auf zwei großen Datensätzen, Kinetics und NTU-RGBD, erreicht das Modell erhebliche Verbesserungen gegenüber etablierten Ansätzen.