16日前
FreeMotion:数値フリーなテキストからモーションへの合成を統合するフレームワーク
Ke Fan, Junshu Tang, Weijian Cao, Ran Yi, Moran Li, Jingyu Gong, Jiangning Zhang, Yabiao Wang, Chengjie Wang, Lizhuang Ma

要約
テキストからモーションへの合成は、コンピュータビジョンにおける重要な課題である。従来の手法は、単一人物または二人の人物に限定されたシナリオに特化しており、それ以上の人数のモーション生成には適用できないという限界がある。本研究では、人数に依存しないモーション合成を実現するために、モーション生成のアプローチを見直し、条件付きモーション分布を用いて単一人物と複数人物のモーションを統一的に扱う新たなアーキテクチャを提案する。さらに、本研究で提案するFreeMotionフレームワークでは、条件付きモーション生成と相互作用のプロセスを分離するために、生成モジュールと相互作用モジュールを設計した。これにより、人数に依存しないモーション合成が可能となった。また、本フレームワークを基盤とすることで、既存の単一人物モーションの空間的制御手法をスムーズに統合でき、複数人物のモーションを高精度に制御することが可能になった。広範な実験により、本手法の優れた性能および、単一人物および複数人物のモーションを同時に推論する能力が確認された。