2ヶ月前

SOM-VAE: 時系列データの解釈可能な離散表現学習

Vincent Fortuin; Matthias Hüser; Francesco Locatello; Heiko Strathmann; Gunnar Rätsch
SOM-VAE: 時系列データの解釈可能な離散表現学習
要約

高次元時系列データは多くの分野で一般的に見られます。人間の認知は高次元空間での作業を最適化されていないため、これらの分野は解釈可能な低次元表現から恩恵を受けうる可能性があります。しかし、時系列データ向けの大部分の表現学習アルゴリズムは解釈が困難です。これは、データ特徴量から表現の重要な特性への非直感的なマッピングと時間的な非滑らかさによるものです。この問題に対処するために、我々は解釈可能な離散次元削減と深層生成モデルのアイデアに基づいた新しい表現学習フレームワークを提案します。このフレームワークにより、時系列データの離散表現を学習し、優れたクラスタリング性能を持つ滑らかで解釈可能な埋め込みを生成することができます。また、離散表現学習における非微分性の問題を克服する新しい方法を導入し、従来の自己組織化マップアルゴリズムよりも高性能な勾配ベースバージョンを提示します。さらに、我々の手法に確率的な解釈を可能にするために、表現空間にマルコフモデルを統合しました。このモデルは時間的な遷移構造を明らかにし、クラスタリング性能をさらに向上させるとともに、追加の説明的洞察と不確実性の自然な表現も提供します。我々は静的な(ファッション)MNISTデータ、線形補間された(ファッション)MNIST画像の時系列、2つのマクロ状態を持つカオス的なローレンツアトラクターシステム、そしてeICUデータセット上の医療時系列アプリケーションという複雑な実世界問題に対して、モデルのクラスタリング性能と解釈可能性について評価を行いました。学習した表現は競合手法と比較して有利であり、実世界データでの下流タスクを容易にすることが示されました。