HyperAIHyperAI
vor 2 Monaten

Ein Vergleich neuer Kinect-basierter Aktionserkennungsalgorithmen

Lei Wang; Du Q. Huynh; Piotr Koniusz
Ein Vergleich neuer Kinect-basierter Aktionserkennungsalgorithmen
Abstract

Die video-basierte Erkennung menschlicher Aktivitäten ist derzeit eines der aktivsten Forschungsgebiete in der Computer Vision. Verschiedene Studien zeigen, dass die Leistungsfähigkeit der Aktionserkennung stark von den extrahierten Merkmalsarten und der Art der Darstellung der Aktionen abhängt. Seit dem Erscheinen der Kinect-Kamera wurden in der Literatur zahlreiche Kinect-basierte Techniken zur Erkennung menschlicher Aktivitäten vorgeschlagen. Es gibt jedoch noch immer keine gründliche Vergleichsanalyse dieser Kinect-basierten Methoden unter Berücksichtigung von Merkmalsarten, wie z.B. handgefertigte (handcrafted) versus tiefenschulende (deep learning) Merkmale und tiefenbasierte (depth-based) versus skelettbasierte (skeleton-based) Merkmale.In dieser Arbeit analysieren und vergleichen wir zehn aktuelle Kinect-basierte Algorithmen für die Aktionserkennung sowohl bei unterschiedlichen Probanden (cross-subject action recognition) als auch bei unterschiedlichen Aufnahmewinkeln (cross-view action recognition), indem wir sechs Benchmark-Datensätze verwenden. Zudem haben wir einige dieser Techniken implementiert und verbessert und ihre Varianten in den Vergleich einbezogen. Unsere Experimente zeigen, dass die meisten Methoden bei der Aktionserkennung bei unterschiedlichen Probanden besser abschneiden als bei unterschiedlichen Aufnahmewinkeln, dass skelettbasierte Merkmale für die Aktionserkennung bei unterschiedlichen Aufnahmewinkeln robuster sind als tiefenbasierte Merkmale und dass tiefenschulende Merkmale für große Datensätze geeignet sind.