2ヶ月前
人間の動きからシーン合成
Ye, Sifan ; Wang, Yixing ; Li, Jiaman ; Park, Dennis ; Liu, C. Karen ; Xu, Huazhe ; Wu, Jiajun

要約
大規模な人間の動きの捕捉は、多様で複雑なシーンにおいて非常に有用である一方で、しばしば費用がかかりすぎると考えられています。しかし、人間の動き自体には、その人が存在し、相互作用するシーンに関する豊富な情報が含まれています。例えば、座っている人間は椅子の存在を示唆し、その足の位置はさらに椅子の姿勢を暗示します。本論文では、人間の動きに基づいて多様で意味的に適切かつ物理的に実現可能なシーンを合成する手法を提案します。我々のフレームワーク「Scene Synthesis from HUMan MotiON(SUMMON)」は2つのステップから構成されています。まず、新たに導入した接触予測器「ContactFormer」を使用して、人間の動きから時間的に一貫した接触ラベルを取得します。これらの予測に基づいて、SUMMONは相互作用する物体を選択し、物理的な実現可能性損失を最適化します。さらに、人間と直接相互作用しない物体もシーンに配置します。実験結果は、SUMMONが実現可能で信頼性があり多様なシーンを合成できることを示しており、コミュニティのために広範な人間-シーン相互作用データを生成する潜在能力があることを示しています。