11日前
InterGen:複雑な相互作用下における拡散モデルを用いた複数人運動生成
Han Liang, Wenqian Zhang, Wenxuan Li, Jingyi Yu, Lan Xu

要約
近年、現実的な人体運動を生成するための拡散モデルの進展は著しく、その成果は目覚ましいものがある。しかし、こうした手法は多体間の相互作用をほとんど考慮していない。本論文では、人体間の相互作用を運動拡散プロセスに組み込む効果的な拡散ベースのアプローチ、InterGenを提案する。これにより、テキストによるガイダンスのみで、一般ユーザーが高品質な二人組の相互作用運動をカスタマイズ可能となる。まず、本研究では、多モーダルなデータセット「InterHuman」を構築した。このデータセットは、多様な二人組相互作用を網羅する約1億700万フレームを含み、正確な骨格運動データと23,337件の自然言語記述を備えている。アルゴリズム面では、二人の人物間相互作用を想定した設定に合わせて、運動拡散モデルを精緻にカスタマイズした。相互作用中の人体の同一性の対称性に対処するため、重みを共有する2つの協調的Transformerベースのノイズ除去器を提案し、相互注意機構を導入することで、2つのノイズ除去プロセスをさらに連携させた。さらに、本研究では、世界座標系における2人のパフォーマー間のグローバルな関係を明示的に定式化した新しい運動入力表現を提案した。また、空間的関係を効果的に符号化するための2つの新規正則化項を導入し、拡散モデルの学習過程において対応する減衰スキームを採用した。広範な実験により、InterGenの有効性と汎用性が検証された。特に、従来の手法と比較して、より多様で魅力的な二人組運動の生成が可能であり、人体相互作用を対象とした多様な下流応用を実現できることが示された。