2ヶ月前

PREDICT & CLUSTER: 監督なし骨格ベースの動作認識

Kun Su; Xiulong Liu; Eli Shlizerman
PREDICT & CLUSTER: 監督なし骨格ベースの動作認識
要約

私たちは、教師なし骨格ベースの動作認識システムを提案します。様々な動きから得られる身体キーポイントのシーケンスを入力として、当該システムはこれらのシーケンスを動作に結び付けます。本システムはエンコーダー-デコーダー型の再帰型ニューラルネットワーク(RNN)に基づいており、モデルが予測タスクを行うように訓練することで、エンコーダーがその隠れ状態内で分離可能な特徴表現を学習します。我々は、このような教師なし訓練により、デコーダーとエンコーダーが隠れ状態を自己組織化し、類似した動きを同じクラスタに集め、異なる動きを遠く離れたクラスタに分ける特徴空間を作り出すことを示しています。現在の最先端の動作認識手法は強教師ありであり、つまり訓練のためにラベルの提供に依存しています。教師なし手法も提案されていますが、それらは各時間ステップでカメラと深度情報(RGB+D)の入力を必要とします。一方、私たちのシステムは完全な教師なしであり、どの段階でも動作のラベルを必要とせず、身体キーポイントのみの入力で動作できます。さらに、この手法は身体キーポイントのさまざまな次元(2Dまたは3D)に対応でき、動きを記述する追加的なヒントも含めることができます。私たちは3つの広範な動作認識ベンチマークデータセットにおいて評価を行い、それぞれ異なる数の動作とサンプルを使用しました。結果は既存の教師なし骨格ベース方法や教師なしRGB+Dベース方法よりも優れており、また教師あり骨格ベースの動作認識との間で類似した性能を達成しています。

PREDICT & CLUSTER: 監督なし骨格ベースの動作認識 | 最新論文 | HyperAI超神経