13日前

DLow:多様な潜在フローを用いた多様な人間の運動予測

Ye Yuan, Kris Kitani
DLow:多様な潜在フローを用いた多様な人間の運動予測
要約

深層生成モデルは、多モーダルなデータ分布をモデル化し、多様な人間の行動を表現できるため、人間の運動予測において広く用いられている。近年、深層生成モデルの設計および学習に多くの研究努力が注がれているが、モデルの学習が完了した後、効率的に多様なサンプルを生成する方法については、依然として十分に検討されていない問題である。既存の生成的運動予測手法の多くは、事前学習済みの生成モデルからサンプルを得る際、独立したガウス分布からのランダムな潜在コードを複数生成し、それを運動サンプルに変換するアプローチを採用している。しかし、このランダムサンプリング戦略には二つの問題がある。第一に、独立したサンプリングではサンプル間の多様性を強制する仕組みが存在しないため、多様なサンプルが保証されない。第二に、サンプリングは尤度に基づいているため、データ分布の主要モード(major modes)に対応するサンプルしか生成されず、多様性に乏しい結果となる可能性がある。これらの課題に対処するため、本研究では、事前学習済みの深層生成モデルから多様なサンプルを効率的に生成するための新しいサンプリング手法「Diversifying Latent Flows(DLow)」を提案する。従来のランダム(独立)サンプリングとは異なり、DLowは一度のランダム変数のサンプリングに基づき、学習可能なマッピング関数群を用いて、相関を持つ潜在コードの集合を生成する。その後、これらの相関ある潜在コードをデコードすることで、相関を持つサンプルの集合を得る。学習段階では、生成サンプルの多様性を促進するための事前分布(diversity-promoting prior)を目的関数として用い、潜在マッピングを最適化する。この事前分布の設計は非常に柔軟であり、例えば脚部の動きが類似しつつ上半身の動きが多様になるような運動を生成するようにカスタマイズ可能である。実験の結果、DLowはサンプルの多様性と精度の両面で、最先端のベースライン手法を上回ることを示した。本研究のコードは、プロジェクトページにて公開されている:https://www.ye-yuan.com/dlow。

DLow:多様な潜在フローを用いた多様な人間の運動予測 | 最新論文 | HyperAI超神経