Réseaux d'inférence structurés pour les modèles d'espace d'état non linéaires

Les modèles d'espace d'état gaussiens sont utilisés depuis des décennies comme modèles génératifs de données séquentielles. Ils admettent une interprétation probabiliste intuitive, ont une forme fonctionnelle simple et bénéficient d'une adoption généralisée. Nous présentons un algorithme unifié permettant d'apprendre efficacement une large classe de modèles d'espace d'état linéaires et non-linéaires, y compris les variantes où les distributions émissives et de transition sont modélisées par des réseaux neuronaux profonds. Notre algorithme d'apprentissage apprend simultanément un réseau de déduction compilé et le modèle génératif, en exploitant une approximation variationnelle structurée paramétrée par des réseaux neuronaux récurrents pour imiter la distribution a posteriori. Nous appliquons cet algorithme d'apprentissage à des jeux de données synthétiques et réels, démontrant sa scalabilité et sa polyvalence. Nous constatons que l'utilisation de l'approximation structurée de la distribution a posteriori conduit à des modèles présentant une vraisemblance hors échantillon significativement plus élevée.