2ヶ月前
欠損データを含む多変量時系列の表現学習にTemporal Kernelized Autoencodersを使用する
Filippo Maria Bianchi; Lorenzo Livi; Karl Øyvind Mikalsen; Michael Kampffmeyer; Robert Jenssen

要約
多変量時系列データ(MTS)の圧縮表現を学習することで、ノイズや冗長な情報が存在する状況下でのデータ分析が容易になり、多くの変数と時間ステップを持つ場合でも効果的です。しかし、古典的な次元削減手法はベクトルデータ向けに設計されており、欠損値を明示的に処理することはできません。本研究では、再帰型ニューラルネットワークに基づく新しいオートエンコーダー構造を提案し、MTSの圧縮表現を生成します。提案されたモデルは可変長の入力を処理でき、特に欠損データの処理に特化して設計されています。当該オートエンコーダーは固定長のベクトル表現を学習し、そのペアワイズ類似度は入力空間で動作し欠損値を扱うカーネル関数と整合性を持たせます。これにより、大量の欠損データが存在する場合でも良質な表現を学習することが可能になります。提案手法の有効性を示すために、医療データなどを含む複数の分類タスクにおいて学習した表現の品質を評価し、他の次元削減手法と比較しました。その後、提案されたアーキテクチャに基づいて2つのフレームワークを設計しました:1つは欠損データの補完用であり、もう1つは一クラス分類用です。最後に、再帰層を持つオートエンコーダーがフィードフォワードアーキテクチャよりも優れた圧縮表現を学習できる条件について分析しました。