AIST++ は、AIST ダンス ビデオ データベースから構築された大規模なマルチモーダル 3D ダンス動作データセットです。マルチビュー ビデオの場合、著者らはカメラ パラメーター、3D 人体のキーポイント、および 3D 人間のダンス動作シーケンスを推定するための精巧なパイプラインを設計しました。
- このデータセットは、9 つのビューで 30 の異なる被写体をカバーする 1,010 万枚の画像に対する 3D 人体のキー ポイント アノテーションとカメラ パラメーターを提供します。これらのプロパティにより、3D 人体キーポイント アノテーションを備えた既存のデータセットとしては最大かつ最も豊富なものになります。
- このデータセットには、10 種類のダンスをカバーする 1,408 のシーケンスに分割された 5.2 時間の 3D ダンスの動きが含まれており、それぞれのシーケンスには既知のカメラ位置方向から撮影されたマルチビュー ビデオが含まれています。