HyperAIHyperAI

Command Palette

Search for a command to run...

深層かつコンパクトなモデルを用いたジェスチャ認識の学習

Koustav Mullick; Anoop M. Namboodiri

概要

ビデオからジェスチャ認識を行う深層学習フレームワークにおけるコンパクトで精度の高いモデル開発の問題を取り上げます。この目的のために、エンドツーエンドで学習可能な3D-CNN-LSTM統合モデルを提案します。本モデルは、動作の動的な情報をより適切に捉えることが示されています。この解決策は、ChaLearnデータセットにおいて最新の最先端技術に匹敵する精度を達成しており、かつモデルサイズは半分となっています。さらに、知識蒸留フレームワークによる非常にコンパクトな表現の導出方法と、その後のモデル圧縮手法についても検討しました。最終的なモデルは1 MB未満(初期モデルの100分の1以下)であり、精度が7%低下したものの、モバイルデバイスでのリアルタイムジェスチャ認識に適しています。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています