7日前

変分オートエンコーダにおけるガウス過程を用いた動画シーケンスの複数特徴の分離

Sarthak Bhagat, Shagun Uppal, Zhuyun Yin, Nengli Lim
変分オートエンコーダにおけるガウス過程を用いた動画シーケンスの複数特徴の分離
要約

我々は、動画系列における非教師学習による分離表現の学習を目的として、潜在空間をガウス過程(GP)でモデル化する変分オートエンコーダである「MGP-VAE(Multi-disentangled-features Gaussian Processes Variational AutoEncoder)」を提案する。従来の研究を改良し、複数の特徴量(静的または動的)を同時に分離するフレームワークを構築した。具体的には、各独立チャネルにおいてフレーム間の相関構造を強制するために、分数ブラウン運動(fBM)およびブラウンブリッジ(BB)を用い、この構造を変化させることでデータ内の異なる変動要因を捉えることが可能であることを示した。3つの公に提供されているデータセットを用いた実験により、本手法の表現能力の高さを検証し、動画予測タスクを通じて性能向上を定量的に評価した。さらに、データ多様体の曲率を考慮した新たな測地線損失関数(geodesic loss function)を導入し、学習の精度を向上させた。実験の結果、改善された表現と新規損失関数の組み合わせにより、MGP-VAEはベースライン手法を上回る動画予測性能を達成したことが明らかになった。

変分オートエンコーダにおけるガウス過程を用いた動画シーケンスの複数特徴の分離 | 最新論文 | HyperAI超神経