Apprentissage bayésien à partir de données séquentielles en utilisant des processus gaussiens avec covariances de signature

Nous développons une approche bayésienne pour l'apprentissage à partir de données séquentielles en utilisant des processus gaussiens (PG) avec des noyaux de signature comme fonctions de covariance. Cela permet de rendre comparables des séquences de longueurs différentes et de s'appuyer sur des résultats théoriques solides issus de l'analyse stochastique. Les signatures capturent la structure séquentielle grâce à des tenseurs qui peuvent malheureusement augmenter de manière défavorable avec la longueur des séquences et la dimension de l'espace d'état. Pour remédier à ce problème, nous introduisons une approche variationnelle parcimonieuse avec des tenseurs d'induction. Nous combinons ensuite le PG résultant avec les LSTM et GRU pour construire des modèles plus complexes qui exploitent les forces de chacune de ces méthodes, puis nous évaluons ces PG sur des jeux de données de classification de séries temporelles multivariées (TS). Le code est disponible à l'adresse suivante : https://github.com/tgcsaba/GPSig.