Tiefes Lernen für die Handsignalerkennung auf skelettalen Daten
{Guillaume Devineau Fabien Moutarde Jie Yang Wang Xi}

Abstract
In diesem Artikel stellen wir einen neuen Ansatz zur 3D-Handgestenerkennung vor, der auf einem tiefen Lernmodell basiert. Wir führen ein neuartiges konvolutionales Neuronales Netzwerk (Convolutional Neural Network, CNN) ein, bei dem Sequenzen der Positionen von Hand-Skelett-Gelenken durch parallele Faltungen verarbeitet werden. Anschließend untersuchen wir die Leistungsfähigkeit dieses Modells bei der Klassifikation von Handgestensequenzen. Unser Modell nutzt ausschließlich Daten zu Hand-Skelett-Positionen und keine Tiefenbilder. Experimentelle Ergebnisse zeigen, dass unser Ansatz im Vergleich zu anderen veröffentlichten Methoden eine state-of-the-art-Leistung auf einem anspruchsvollen Datensatz (DHG-Datensatz aus dem SHREC 2017 3D-Shape-Retrieval-Wettbewerb) erzielt. Für den Fall mit 14 Gestenklassen erreicht unser Modell eine Klassifikationsgenauigkeit von 91,28 %, bei 28 Gestenklassen beträgt die Genauigkeit 84,35 %.
Benchmarks
| Benchmark | Methodik | Metriken |
|---|---|---|
| hand-gesture-recognition-on-dhg-14 | Parallel-Conv | Accuracy: 91.28 |
| hand-gesture-recognition-on-dhg-28 | Parallel-Conv | Accuracy: 84.35 |
KI mit KI entwickeln
Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.