2ヶ月前
時間系列データストリームにおける欠損データの推定に多方向再帰型ニューラルネットワークを使用する
Jinsung Yoon; William R. Zame; Mihaela van der Schaar

要約
欠損データは普遍的な問題であり、特に医療現場では多くの測定値が異なる時間帯で、そしてしばしば不規則な間隔で収集されるため、非常に困難な課題となっています。これらの欠損測定値の正確な推定は、診断、予後判断、治療など多くの理由から重要です。既存の方法では、データストリーム内の補間やデータストリーム間の補完(これらは重要な情報を無視する)を行ったり、データの時間的側面を無視してデータ生成プロセスや欠損パターンについて強い仮定を課したりします(これらは特に医療データに対して問題となる)。本研究では、新しいアプローチを提案し、これを多方向再帰型ニューラルネットワーク(Multi-directional Recurrent Neural Network, M-RNN)と呼びます。このアプローチはデータストリーム内での補間とデータストリーム間での補完を両方行います。我々はこの手法の有効性を5つの実際の医療データセットに適用することで示しました。その結果、11種類の最先端ベンチマーク(スプライン補間や3次補間、MICE, MissForest, 行列完成法およびいくつかのRNN手法を含む)と比較して、欠損測定値の推定精度が大幅に向上することが確認されました;典型的にはルート平均二乗誤差(RMSE)が35% - 50%改善しました。さらに同じ5つのデータセットに基づく追加実験により、当手法による改善が極めて堅牢であることが示されました。