2ヶ月前
Two-Stream Adaptive Graph Convolutional Networks for Skeleton-Based Action Recognition を翻訳します。 骨格に基づく動作認識のための二重ストリーム適応グラフ畳み込みネットワーク
Lei Shi; Yifan Zhang; Jian Cheng; Hanqing Lu

要約
骨格に基づく動作認識において、人間の骨格を空間時間的なグラフとしてモデル化するグラフ畳み込みネットワーク(GCNs)は、著しい性能を達成しています。しかし、既存のGCNベースの手法では、グラフのトポロジーが手動で設定され、すべての層と入力サンプルに対して固定されています。これは、階層的なGCNや多様なサンプルを持つ動作認識タスクにとって最適ではない可能性があります。さらに、骨格データの二次情報(骨の長さと方向)は、動作認識にとって自然に更多信息量があり識別力が高いにもかかわらず、既存の手法ではほとんど調査されていません。本研究では、骨格に基づく動作認識のために新しい二ストリーム適応型グラフ畳み込みネットワーク(2s-AGCN)を提案します。当モデルにおけるグラフのトポロジーは、BPアルゴリズムによりエンドツーエンドで一様または個別に学習することができます。このデータ駆動型方法は、グラフ構築におけるモデルの柔軟性を高めるとともに、さまざまなデータサンプルに対応する汎用性も向上させます。また、一次情報と二次情報を同時にモデル化するための二ストリームフレームワークを提案しており、認識精度に顕著な改善をもたらしています。大規模データセットであるNTU-RGBDとKinetics-Skeletonでの広範な実験結果から、当モデルの性能が現行最先端技術を大幅に上回ることが示されています。