HyperAIHyperAI

Command Palette

Search for a command to run...

Multimodales mehrteiliges Lernen zur Aktionserkennung in Tiefenbildern

Shahroudy Amir Wang Gang Ng Tian-Tsong Yang Qingxiong

Zusammenfassung

Die komplizierte und gliedrige Natur menschlicher Handlungen macht die Aufgabe der Handlungsidentifikation schwierig. Ein Ansatz zur Bewältigung dieser Komplexität besteht darin, die Bewegung in die Kinematik einzelner Körperteile zu zerlegen und die Handlungen basierend auf diesen lokalen Beschreibern zu analysieren. Wir schlagen eine Lernmethode auf Basis gemeinsamer sparser Regression vor, die strukturierte Sparsität nutzt, um jede Handlung als Kombination multimodaler Merkmale aus einer sparsen Auswahl von Körperteilen zu modellieren. Um Dynamik und Erscheinungsbild der Körperteile zu erfassen, verwenden wir eine heterogene Menge an Tiefen- und Skelett-basierten Merkmalen. Die geeignete Struktur der multimodalen Mehrkörperteil-Merkmale wird über einen vorgeschlagenen hierarchischen gemischten Norm-Operator in das Lernframework integriert, um die strukturierten Merkmale jedes Körperteils zu regularisieren und Sparsität zwischen ihnen zu fördern, was einer Gruppenmerkmalsauswahl dient. Unsere experimentellen Ergebnisse belegen die Wirksamkeit der vorgeschlagenen Lernmethode, die in allen drei getesteten Datensätzen andere Ansätze übertrifft und in einem davon eine perfekte Genauigkeit erreicht.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
Multimodales mehrteiliges Lernen zur Aktionserkennung in Tiefenbildern | Paper | HyperAI