Lorsque les ondelettes spatio-temporelles se rencontrent : une prévision du trafic désentrelacée via des réseaux d'attention spectrale sur graphe efficaces
La prévision du trafic est essentielle pour la sécurité publique et l’optimisation des ressources, mais demeure extrêmement difficile en raison des évolutions temporelles et des corrélations spatiales dynamiques présentes dans les données de trafic. Pour capturer ces dépendances complexes, des réseaux spatio-temporels tels que les réseaux de neurones récurrents combinés à des réseaux de convolution sur graphe, les réseaux de convolution sur graphe couplés à des réseaux de convolution temporels, ou encore les réseaux d’attention temporelle intégrant une attention complète sur graphe sont couramment utilisés. Toutefois, les modèles spatio-temporels précédents reposent sur une formation end-to-end, ce qui les rend insensibles aux décalages de distribution dans les séries temporelles de trafic non stationnaires. D’un autre côté, les algorithmes efficaces et performants pour modéliser les corrélations spatiales font encore défaut dans les architectures antérieures. Dans cet article, au lieu de proposer un nouveau modèle end-to-end, nous introduisons un cadre innovant de fusion désentrelacée, nommé STWave, visant à atténuer le problème des décalages de distribution. Ce cadre décompose d’abord les données de trafic complexes en tendances stables et en événements fluctuants, puis utilise un réseau spatio-temporel à deux canaux pour modéliser séparément ces deux composantes. Enfin, une prévision raisonnable du trafic futur est obtenue par fusion des tendances et des événements. Par ailleurs, nous intégrons une nouvelle stratégie d’échantillonnage de requêtes ainsi qu’une encodage positionnel sur graphe basé sur les ondelettes de graphe dans le réseau d’attention complète sur graphe, afin de modéliser efficacement et précisément les corrélations spatiales dynamiques. Des expériences étendues sur six jeux de données de trafic démontrent l’efficacité de notre approche, qui atteint une précision de prévision supérieure tout en nécessitant un coût computationnel réduit.