2ヶ月前

多人の3D動作予測に向けたマルチレンジトランスフォーマーの利用

Wang, Jiashun ; Xu, Huazhe ; Narasimhan, Medhini ; Wang, Xiaolong
多人の3D動作予測に向けたマルチレンジトランスフォーマーの利用
要約

私たちは、複数人の3次元動作軌道予測のための新しいフレームワークを提案します。私たちの主要な観察点は、人間の行動や挙動が周囲の人々に大きく依存する可能性があることです。したがって、各個人の動作軌道を個別に予測するのではなく、個々の動作を処理するローカルレンジエンコーダと社会的な相互作用を処理するグローバルレンジエンコーダを含むマルチレンジトランスフォーマー(Multi-Range Transformers)モデルを導入しました。トランスフォーマーデコーダは、対応する姿勢をクエリとして取り扱い、ローカルおよびグローバルレンジエンコーダの特徴に注意を払いつつ、各人物の予測を行います。当モデルは長期的な3次元動作予測において最先端の手法を上回るだけでなく、多様な社会的相互作用も生成します。さらに興味深いことに、当モデルは自動的に人物を異なる相互作用グループに分割することで、最大15人の動作を同時に予測することができます。プロジェクトページとコードは以下のURLで公開されています: https://jiashunwang.github.io/MRT/。

多人の3D動作予測に向けたマルチレンジトランスフォーマーの利用 | 最新論文 | HyperAI超神経