2ヶ月前

深層かつコンパクトなモデルを用いたジェスチャ認識の学習

Koustav Mullick; Anoop M. Namboodiri
深層かつコンパクトなモデルを用いたジェスチャ認識の学習
要約

ビデオからジェスチャ認識を行う深層学習フレームワークにおけるコンパクトで精度の高いモデル開発の問題を取り上げます。この目的のために、エンドツーエンドで学習可能な3D-CNN-LSTM統合モデルを提案します。本モデルは、動作の動的な情報をより適切に捉えることが示されています。この解決策は、ChaLearnデータセットにおいて最新の最先端技術に匹敵する精度を達成しており、かつモデルサイズは半分となっています。さらに、知識蒸留フレームワークによる非常にコンパクトな表現の導出方法と、その後のモデル圧縮手法についても検討しました。最終的なモデルは1 MB未満(初期モデルの100分の1以下)であり、精度が7%低下したものの、モバイルデバイスでのリアルタイムジェスチャ認識に適しています。

深層かつコンパクトなモデルを用いたジェスチャ認識の学習 | 最新論文 | HyperAI超神経