8ヶ月前

コンピュータビジョン

コンピュータグラフィックスとマルチメディア

コンピュータビジョン

Sifan Ye Yixing Wang Jiaman Li Dennis Park C. Karen Liu Huazhe Xu Jiajun Wu

概要

大規模な人間の動きの捕捉は、多様で複雑なシーンにおいて非常に有用である一方で、しばしば費用がかかりすぎると考えられています。しかし、人間の動き自体には、その人が存在し、相互作用するシーンに関する豊富な情報が含まれています。例えば、座っている人間は椅子の存在を示唆し、その足の位置はさらに椅子の姿勢を暗示します。本論文では、人間の動きに基づいて多様で意味的に適切かつ物理的に実現可能なシーンを合成する手法を提案します。我々のフレームワーク「Scene Synthesis from HUMan MotiON（SUMMON）」は2つのステップから構成されています。まず、新たに導入した接触予測器「ContactFormer」を使用して、人間の動きから時間的に一貫した接触ラベルを取得します。これらの予測に基づいて、SUMMONは相互作用する物体を選択し、物理的な実現可能性損失を最適化します。さらに、人間と直接相互作用しない物体もシーンに配置します。実験結果は、SUMMONが実現可能で信頼性があり多様なシーンを合成できることを示しており、コミュニティのために広範な人間-シーン相互作用データを生成する潜在能力があることを示しています。

ソースPDF コードを表示

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

8ヶ月前

コンピュータビジョン

コンピュータグラフィックスとマルチメディア

コンピュータビジョン

Sifan Ye Yixing Wang Jiaman Li Dennis Park C. Karen Liu Huazhe Xu Jiajun Wu

概要

大規模な人間の動きの捕捉は、多様で複雑なシーンにおいて非常に有用である一方で、しばしば費用がかかりすぎると考えられています。しかし、人間の動き自体には、その人が存在し、相互作用するシーンに関する豊富な情報が含まれています。例えば、座っている人間は椅子の存在を示唆し、その足の位置はさらに椅子の姿勢を暗示します。本論文では、人間の動きに基づいて多様で意味的に適切かつ物理的に実現可能なシーンを合成する手法を提案します。我々のフレームワーク「Scene Synthesis from HUMan MotiON（SUMMON）」は2つのステップから構成されています。まず、新たに導入した接触予測器「ContactFormer」を使用して、人間の動きから時間的に一貫した接触ラベルを取得します。これらの予測に基づいて、SUMMONは相互作用する物体を選択し、物理的な実現可能性損失を最適化します。さらに、人間と直接相互作用しない物体もシーンに配置します。実験結果は、SUMMONが実現可能で信頼性があり多様なシーンを合成できることを示しており、コミュニティのために広範な人間-シーン相互作用データを生成する潜在能力があることを示しています。

ソースPDF コードを表示

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています