DualSG : Un cadre de prévision des séries temporelles multivariées à guide sémantique explicite à deux flux

La prévision des séries temporelles multivariées joue un rôle clé dans de nombreuses applications. Les travaux récents ont exploré l'utilisation de modèles de langage à grande échelle (LLM) pour la prévision des séries temporelles multivariées, afin d'exploiter leurs capacités de raisonnement. Cependant, de nombreuses méthodes considèrent les LLM comme des prédicteurs en bout de chaîne (end-to-end), ce qui entraîne souvent une perte de précision numérique et force les LLM à gérer des motifs au-delà de leur conception initiale. D'autre part, les méthodes qui tentent d'aligner les modalités textuelles et les séries temporelles dans un espace latent rencontrent fréquemment des difficultés d'alignement. Dans cet article, nous proposons de considérer les LLM non pas comme des prédicteurs autonomes, mais comme des modules de guidance sémantique au sein d'un cadre à deux flux (dual-stream). Nous introduisons DualSG, un cadre à deux flux qui offre une guidance sémantique explicite, où les LLM agissent comme des Guides Sémantiques pour affiner, plutôt que remplacer, les prédictions traditionnelles. Comme partie intégrante de DualSG, nous présentons Time Series Caption, un format de prompt explicite qui résume les tendances des séries temporelles en langage naturel et fournit un contexte interprétable aux LLM, plutôt que de s'appuyer sur un alignement implicite entre le texte et les séries temporelles dans l'espace latent. Nous avons également conçu un module de fusion guidé par la caption, qui modélise explicitement les relations entre les variables tout en réduisant le bruit et la charge de calcul. Les expériences sur des ensembles de données réels provenant de domaines divers montrent que DualSG dépasse de manière constante 15 méthodes de référence de pointe, démontrant ainsi la valeur de la combinaison explicite de la prévision numérique et de la guidance sémantique.