2ヶ月前

2D/3D ポーズ推定とマルチタスク深層学習を用いた動作認識

Diogo C. Luvizon; David Picard; Hedi Tabia
2D/3D ポーズ推定とマルチタスク深層学習を用いた動作認識
要約

行動認識と人間の姿勢推定は密接に関連していますが、一般的にこれらの問題は文献で異なるタスクとして扱われています。本研究では、静止画像からの2Dおよび3D姿勢推定と動画シーケンスからの人間の行動認識を同時に行うためのマルチタスクフレームワークを提案します。私たちは、単一のアーキテクチャを使用することで、効率的に両方の問題を解決しつつ、最先端の結果を得られることを示します。さらに、エンドツーエンドでの最適化が分離した学習よりも大幅に高い精度を達成することを証明しました。提案されたアーキテクチャは、異なるカテゴリから同時にデータを学習できるように設計されており、シームレスな訓練が可能です。4つのデータセット(MPII、Human3.6M、Penn Action、NTU)における報告された結果は、当該タスクに対する私たちの方法の有効性を示しています。

2D/3D ポーズ推定とマルチタスク深層学習を用いた動作認識 | 最新論文 | HyperAI超神経