16日前
補助空間からのGumbel-Softmaxサンプリングを用いた多様なヒューマンモーション予測
Lingwei Dang, Yongwei Nie, Chengjiang Long, Qing Zhang, Guiqing Li

要約
多様な人体運動予測は、観測されたポーズ系列から複数の可能な将来のポーズ系列を予測することを目的としている。従来の手法は、通常、深層生成ネットワークを用いてデータの条件付き分布をモデル化し、その分布からランダムにサンプリングを行う。これにより異なる結果を得ることは可能であるが、それらは一般的に最も確率の高いものに偏り、十分な多様性を確保できない。近年の研究では、決定論的ネットワークを用いて条件付き分布の複数のモードを明示的に学習するアプローチが提案されているが、これには制限があり、固定された数のモードしかカバーできず、その範囲も限定的である。本論文では、深層生成モデルによって学習された不均衡な多モーダル分布から極めて多様な結果をサンプリングするための新たなサンプリング戦略を提案する。本手法は、補助空間を生成し、この補助空間からのランダムサンプリングを、ターゲット分布からの多様なサンプリングと等価にするというアプローチを採用している。さらに、この新しいサンプリング戦略を実装するシンプルかつ効果的なネットワークアーキテクチャを提案し、Gumbel-Softmax係数行列のサンプリング法と、多様性を促進する積極的なヒンジ損失関数を組み込んでいる。広範な実験により、従来の最先端サンプリング手法と比較して、本手法がサンプリングの多様性と精度の両面で顕著な向上を達成していることが実証された。コードおよび事前学習済みモデルは、https://github.com/Droliven/diverse_sampling にて公開されている。