Prédiction de la variation des cours boursiers à partir de tweets et de données historiques

La prédiction des mouvements des actions constitue un problème difficile : le marché est fortement stochastique, et nous devons effectuer des prédictions dépendantes du temps à partir de données chaotiques. Nous prenons en compte ces trois complexités et proposons un nouveau modèle génératif profond qui exploite conjointement les signaux textuels et les données de prix pour cette tâche. Contrairement aux approches discriminatives ou aux modèles de traitement de sujets, notre modèle introduit des variables latentes récurrentes et continues afin de mieux gérer la stochasticité, et utilise une inférence variationnelle neuronale pour traiter l'inférence a posteriori intractable. Nous proposons également une fonction objectif hybride enrichie par des auxiliaires temporels, permettant une capture souple des dépendances prédictives. Nous démontrons les performances de pointe de notre modèle proposé sur un nouveau jeu de données pour la prédiction des mouvements des actions, que nous avons collecté.