11日前
対比拡散を用いた制御可能なグループ振付
Nhat Le, Tuong Do, Khoa Do, Hien Nguyen, Erman Tjiputra, Quang D. Tran, Anh Nguyen

要約
音楽駆動型のグループ振付は大きな課題を伴う一方で、多岐にわたる産業応用において大きな可能性を秘めています。音楽に合った同期性と視覚的に魅力的なグループダンス動作を生成する能力は、エンターテインメント、広告、バーチャルパフォーマンスなど、さまざまな分野における新たな機会を創出します。しかし、近年の多くの研究は、高精細な長期的な動きを生成することができず、あるいは制御可能な体験を提供できないという課題を抱えています。本研究では、グループ振付の質とカスタマイズ性の両立を実現するため、グループ振付の一貫性と多様性を効果的に制御するアプローチを提案します。特に、拡散モデルに基づく生成手法を活用することで、 dancer の数やダンスの長さを柔軟に設定しつつ、入力音楽との整合性を維持した長期的なグループダンスの合成を可能にしました。さらに、グループ内ダンサー間の関連性を強化するため、Group Contrastive Diffusion(GCD)戦略を導入し、分類器ガイド付きサンプリング技術を用いて、合成されたグループアニメーションの一貫性または多様性レベルを制御可能な形で調整できる能力を実現しました。豊富な実験と評価を通じて、本手法が視覚的に魅力的で一貫性のあるグループダンス動作を効果的に生成できることを示しました。実験結果から、本手法が望ましいレベルの一貫性と多様性を達成しつつ、生成されたグループ振付全体の品質を維持できることを確認しました。ソースコードは以下のURLで公開されています:https://aioz-ai.github.io/GCD