CoSTI : Modèles de cohérence pour l'imputation spatio-temporelle (plus rapide)

L'imputation de séries temporelles multivariées (MTSI) est cruciale pour de nombreuses applications, telles que la surveillance de la santé et la gestion du trafic, où des données incomplètes peuvent compromettre la prise de décision. Les méthodes actuelles les plus performantes, comme les modèles probabilistes de diffusion débruitante (DDPMs), atteignent une précision d'imputation élevée ; cependant, elles souffrent de coûts computationnels importants et sont particulièrement longues à exécuter en raison de leur nature itérative. Dans cette étude, nous proposons CoSTI, une adaptation innovante des modèles de cohérence (CMs) au domaine de l'MTSI. CoSTI utilise l'entraînement par cohérence pour obtenir une qualité d'imputation comparable à celle des DDPMs tout en réduisant considérablement les temps d'inférence, ce qui le rend plus adapté aux applications en temps réel. Nous évaluons CoSTI sur plusieurs jeux de données et scénarios de données manquantes, démontrant jusqu'à une réduction de 98 % du temps d'imputation avec des performances équivalentes à celles des modèles basés sur la diffusion. Cette étude comble le fossé entre efficacité et précision dans les tâches d'imputation générative, offrant une solution évolutrice pour gérer les données manquantes dans des systèmes spatio-temporels critiques.