Prédiction de séries temporelles structurées sans priorité structurelle

La prédiction de séries temporelles est un problème largement étudié et répandu, avec des applications dans de nombreux domaines (médecine, géosciences, analyse de réseaux, finance, économétrie, etc.). Dans le cas des séries temporelles multivariées, la clé d’un bon rendement réside dans la capacité à capturer adéquatement les dépendances entre les variables. Souvent, ces variables sont structurées, c’est-à-dire qu’elles sont localisées dans un espace abstrait, généralement représentant un aspect du monde physique, et la prédiction revient alors à une forme de diffusion de l’information à travers cet espace au fil du temps. Plusieurs modèles de réseaux de neurones basés sur le mécanisme de diffusion ont été proposés dans la littérature. Toutefois, la plupart des approches existantes reposent sur une connaissance a priori de la structure de l’espace, généralement sous la forme d’un graphe qui pondère la capacité de diffusion entre paires de points. Nous affirmons que cette information peut souvent être omise, car les données elles-mêmes contiennent déjà les informations relatives à la capacité de diffusion, et de manière plus fiable que celle fournie par les graphes généralement construits de manière manuelle. Nous proposons donc un modèle entièrement piloté par les données, qui ne dépend ni de tel graphe ni d’aucune autre information structurelle a priori. Nous menons une première série d’expériences afin d’évaluer l’impact d’un prior structurel, tel qu’utilisé dans les modèles de référence, et montrons que, sauf à des niveaux très faibles de données, cet effet reste négligeable, et qu’au-delà d’un certain seuil, il peut même devenir délétère. Nous étudions ensuite, à travers une deuxième série d’expériences, la capacité de notre modèle dans deux directions : la gestion des données manquantes et l’adaptation de domaine.