11日前

生成対抗ネットワークを用いた多次元時系列データの補完

{Yonghong Luo, Yuan Xiaojie, Jun Xu, Ying Zhang, Xiangrui Cai}
生成対抗ネットワークを用いた多次元時系列データの補完
要約

多変量時系列データには通常、多数の欠損値が含まれており、これにより高度な解析手法の適用が阻害される。従来の欠損値処理手法として、平均値・ゼロ補完、ケース削除、行列因子分解に基づく補完などがあるが、これらはすべて多変量時系列データに内在する時間的依存性および複雑な分布特性を適切にモデル化できない。本研究では、欠損値補完問題をデータ生成の枠組みとして捉える。画像生成において成功を収めた生成的対抗ネットワーク(GAN)のアプローチに着想を得て、多変量時系列データ全体の分布をGANによって学習し、その学習結果を用いて各サンプルの欠損値を生成する手法を提案する。画像データとは異なり、時系列データはデータ記録プロセスの性質上、しばしば不完全な形状をとる。このため、不完全な時系列データの時間的不規則性を適切に表現するため、改良型のゲートリカレントユニット(Gated Recurrent Unit, GRU)をGANに導入した。2つの多変量時系列データセットを用いた実験結果から、提案手法は補完精度において従来手法を上回ることが確認された。さらに、補完後のデータに対して単純なモデルを適用した場合でも、予測タスクにおいて最先端の性能が達成された。これは、本手法が下流の応用タスクにおいて顕著な利点を提供することを示している。

生成対抗ネットワークを用いた多次元時系列データの補完 | 最新論文 | HyperAI超神経