Réseaux de Neurones Récursifs pour les Séries Temporelles Multivariées avec Valeurs Manquantes

Les données de séries temporelles multivariées dans des applications pratiques telles que la santé, les géosciences et la biologie sont caractérisées par une variété de valeurs manquantes. Dans les tâches de prédiction de séries temporelles et autres tâches connexes, il a été observé que les valeurs manquantes et leurs motifs de disparition sont souvent corrélés aux étiquettes cibles, ce phénomène est également connu sous le nom d'« absence informative ». Il existe très peu de travaux exploitant ces motifs d'absence pour une imputation efficace et l'amélioration des performances prédictives. Dans cet article, nous développons de nouveaux modèles d'apprentissage profond, notamment le modèle GRU-D, qui fait partie des premières tentatives en la matière. Le modèle GRU-D est basé sur l'Unité Récursive à Portes (Gated Recurrent Unit - GRU), un réseau neuronal récurrent d'avant-garde. Il prend en compte deux représentations des motifs d'absence, à savoir le masquage et l'intervalle temporel, et les intègre efficacement dans une architecture de modèle profond afin non seulement de capturer les dépendances temporelles à long terme dans les séries temporelles, mais aussi d'utiliser ces motifs d'absence pour obtenir de meilleurs résultats prédictifs. Les expériences menées sur des tâches de classification de séries temporelles avec des jeux de données cliniques réels (MIMIC-III, PhysioNet) et synthétiques montrent que nos modèles atteignent des performances de pointe et fournissent des informations utiles pour une meilleure compréhension et utilisation des valeurs manquantes dans l'analyse des séries temporelles.