Unterraum-Clustering für die Aktionserkennung mit Kovarianz-Repräsentationen und zeitlicher Ausdünnung

Diese Arbeit befasst sich mit dem Problem der menschlichen Aktionserkennung, definiert als Klassifizierung der dargestellten Aktion in einer trimmten Sequenz anhand skelettaler Daten. Obwohl die derzeitigen state-of-the-art-Ansätze für diese Anwendung alle überwacht sind, verfolgen wir in dieser Arbeit einen anspruchsvolleren Ansatz: die Lösung des Problems mittels unsupervisierendem Lernen. Dazu stellen wir eine neuartige Subraum-Clustering-Methode vor, die die Kovarianzmatrix nutzt, um die Unterscheidbarkeit der Aktionen zu verbessern, sowie eine Zeitstempel-Pruning-Methode, die es uns ermöglicht, die zeitliche Dimension der Daten effizienter zu handhaben. Durch eine umfassende experimentelle Validierung zeigen wir, dass unsere rechnerische Pipeline bestehende unsupervisierte Ansätze übertrifft und zudem Wettbewerbsfähigkeit gegenüber überwachten Methoden aufweist.