17日前

3D局所畳み込みニューラルネットワークを用いた歩行認識

{Xian-Sheng Hua, Jianqiang Huang, Houqiang Li, Xinmei Tian, Xu Shen, Dixiu Xue, Zhen Huang}
3D局所畳み込みニューラルネットワークを用いた歩行認識
要約

歩行認識の目的は、時間的に変化する特徴から、人体形状に関する独自の空間時間パターンを学習することにある。歩行中に人体の異なる部位は異なる挙動を示すため、各部位の空間時間パターンを個別にモデル化することは直感的である。しかし、従来の部位ベースの手法では、各フレームの特徴マップを固定された水平帯状に均等に分割して局所的な部位を取得している。この帯状分割に基づく手法は、人体部位の正確な位置特定ができないことが明らかである。第一に、同じ帯状領域に異なる部位が重複して現れる(例:腕と胴体)ことがあり、また、同一部位が異なるフレームで異なる帯状領域に現れる(例:手)ことがある。第二に、異なる部位はそれぞれ異なるスケールを持ち、同じ部位であっても異なるフレームでは異なる位置とスケールで現れることがある。第三に、各部位は異なる運動パターン(例:運動の開始フレーム、位置変化の頻度、持続時間)を示す。これらの課題を克服するため、本研究では3D局所操作を提案する。これは、3D歩行認識のバックボーンとして汎用的な構成要素群として設計された新しい手法である。提案する3D局所操作は、時間的・空間的に適応的なスケール、位置、長さを有する、部位ごとの3D局所体積を動的に抽出することを可能にする。これにより、部位ごとの特徴スケール、位置、周波数、持続時間に応じた3D局所近傍から、人体部位の空間時間パターンを効果的に学習できる。実験の結果、本研究で提案する3D局所畳み込みニューラルネットワークは、代表的な歩行認識データセットにおいて最先端の性能を達成した。コードは以下のURLで公開されている:https://github.com/yellowtownhz/3DLocalCNN。

3D局所畳み込みニューラルネットワークを用いた歩行認識 | 最新論文 | HyperAI超神経