HyperAIHyperAI
vor einem Monat

Großmaßstäbliche Isolierte Gestenerkennung mit Faltungsneuronalen Netzen

Pichao Wang; Wanqing Li; Song Liu; Zhimin Gao; Chang Tang; Philip Ogunbona
Großmaßstäbliche Isolierte Gestenerkennung mit Faltungsneuronalen Netzen
Abstract

Dieses Papier schlägt drei einfache, kompakte und dennoch effektive Darstellungen von Tiefenfolgen vor, die jeweils als Dynamische Tiefenbilder (Dynamic Depth Images, DDI), Dynamische Tiefennormalbilder (Dynamic Depth Normal Images, DDNI) und Dynamische Tiefenbewegungsnormalbilder (Dynamic Depth Motion Normal Images, DDMNI) bezeichnet werden. Diese dynamischen Bilder werden aus einer Folge von Tiefenkarten unter Verwendung bidirektionalen Rang-Pooling erstellt, um die räumlich-zeitliche Information effektiv zu erfassen. Solche bildbasierten Darstellungen ermöglichen es uns, existierende ConvNets-Modelle, die auf Bilddaten trainiert wurden, für die Klassifizierung von Tiefenfolgen fein abzustimmen, ohne dabei große Anzahl an Parametern zu lernen einzuführen. Auf Basis der vorgeschlagenen Darstellungen wurde eine Methode basierend auf konvolutionellen Neuronalen Netzen (ConvNets) für die Gestenerkennung entwickelt und im Rahmen der Large-scale Isolated Gesture Recognition Challenge des ChaLearn Looking at People (LAP) 2016 evaluiert. Die Methode erreichte eine Klassifikationsgenauigkeit von 55,57 % und belegte den zweiten Platz in dieser Challenge, lag jedoch sehr dicht am besten Ergebnis, obwohl nur Tiefendaten verwendet wurden.

Großmaßstäbliche Isolierte Gestenerkennung mit Faltungsneuronalen Netzen | Neueste Forschungsarbeiten | HyperAI