
我々は、オンデマンドモーション生成(On-Demand Motion Generation: ODMO)という新しいフレームワークを提案します。このフレームワークは、アクションタイプのみを条件として、現実的で多様な長期的な3次元ヒューマンモーションシーケンスを生成する能力に加えて、カスタマイズの機能も備えています。ODMOは、3つの公開データセット(HumanAct12、UESTC、およびMoCap)上で評価された際、従来のすべてのモーション評価指標においてSOTA(State-of-the-Art)手法よりも改善が見られました。さらに、我々は定性的評価と定量的指標を提供し、本フレームワークが初めて実現したいくつかのカスタマイズ機能について示しています。これらの機能には、モード発見、補間、および軌道カスタマイズが含まれます。これらのカスタマイズ機能により、このようなモーション生成モデルの潜在的な応用範囲が大幅に広がります。この新しいオンデマンド生成機能は、エンコーダーとデコーダーのアーキテクチャにおける革新によって可能となりました。(i)エンコーダー:低次元潜在空間での対照学習を利用し、異なるアクションタイプのコードが異なるグループを形成するだけでなく、同じアクションタイプ内でも類似した内在パターン(モーションスタイル)を持つコードがクラスター化される階層的な埋め込みを作成します。これにより、これらのパターンを容易に発見することが可能となります。(ii)デコーダー:まずモーション軌道を再構築し、その後全体的なモーションシーケンスを再構築する階層的なデコーディング戦略を使用します。このようなアーキテクチャにより効果的な軌道制御が可能となります。我々のコードは以下のGitHubページで公開されています: https://github.com/roychowdhuryresearch/ODMO