Comblement des lacunes : Imputation de séries temporelles multivariées par des réseaux neuronaux graphiques

La gestion des valeurs manquantes et des séries temporelles incomplètes est une tâche fastidieuse, laborieuse et inévitable lors du traitement de données issues d'applications réelles. Des représentations spatio-temporelles efficaces permettraient aux méthodes d'imputation de reconstruire les données temporelles manquantes en exploitant les informations provenant de capteurs situés à différents endroits. Cependant, les méthodes standard échouent à capturer les dépendances non linéaires existant dans le temps et l'espace au sein de réseaux de capteurs interconnectés et ne tirent pas pleinement parti des informations relationnelles disponibles - souvent fortes. En particulier, la plupart des méthodes d'imputation de pointe basées sur l'apprentissage profond ne modélisent pas explicitement les aspects relationnels et, dans tous les cas, n'exploitent pas des cadres de traitement capables de représenter adéquatement les données spatio-temporelles structurées. À l'inverse, les réseaux neuronaux graphiques ont connu ces dernières années une popularité croissante en tant qu'outils expressifs et évolutifs pour le traitement de données séquentielles avec des biais inductifs relationnels. Dans ce travail, nous présentons la première évaluation des réseaux neuronaux graphiques dans le contexte de l'imputation de séries temporelles multivariées. Plus précisément, nous introduisons une nouvelle architecture de réseau neuronal graphique appelée GRIN (Graph-based Recurrent Imputation Network), qui vise à reconstruire les données manquantes dans les différents canaux d'une série temporelle multivariée en apprenant des représentations spatio-temporelles par le passage de messages. Les résultats empiriques montrent que notre modèle surpasse les méthodes de pointe dans la tâche d'imputation sur des benchmarks pertinents issus du monde réel, avec des améliorations du taux d'erreur absolue moyenne souvent supérieures à 20 %.