Command Palette
Search for a command to run...
Multimodales mehrteiliges Lernen zur Aktionserkennung in Tiefenbildern
Multimodales mehrteiliges Lernen zur Aktionserkennung in Tiefenbildern
Shahroudy Amir Wang Gang Ng Tian-Tsong Yang Qingxiong
Zusammenfassung
Die komplizierte und gliedrige Natur menschlicher Handlungen macht die Aufgabe der Handlungsidentifikation schwierig. Ein Ansatz zur Bewältigung dieser Komplexität besteht darin, die Bewegung in die Kinematik einzelner Körperteile zu zerlegen und die Handlungen basierend auf diesen lokalen Beschreibern zu analysieren. Wir schlagen eine Lernmethode auf Basis gemeinsamer sparser Regression vor, die strukturierte Sparsität nutzt, um jede Handlung als Kombination multimodaler Merkmale aus einer sparsen Auswahl von Körperteilen zu modellieren. Um Dynamik und Erscheinungsbild der Körperteile zu erfassen, verwenden wir eine heterogene Menge an Tiefen- und Skelett-basierten Merkmalen. Die geeignete Struktur der multimodalen Mehrkörperteil-Merkmale wird über einen vorgeschlagenen hierarchischen gemischten Norm-Operator in das Lernframework integriert, um die strukturierten Merkmale jedes Körperteils zu regularisieren und Sparsität zwischen ihnen zu fördern, was einer Gruppenmerkmalsauswahl dient. Unsere experimentellen Ergebnisse belegen die Wirksamkeit der vorgeschlagenen Lernmethode, die in allen drei getesteten Datensätzen andere Ansätze übertrifft und in einem davon eine perfekte Genauigkeit erreicht.