HyperAIHyperAI
vor 17 Tagen

PDFormer: propagation delay-orientierter dynamischer Long-Range Transformer für die Verkehrsflussvorhersage

Jiawei Jiang, Chengkai Han, Wayne Xin Zhao, Jingyuan Wang
PDFormer: propagation delay-orientierter dynamischer Long-Range Transformer für die Verkehrsflussvorhersage
Abstract

Als eine zentrale Technologie des Intelligent Transportation Systems (ITS) besitzt die Verkehrsflussvorhersage eine Vielzahl von Anwendungen. Die grundlegende Herausforderung bei der Verkehrsflussvorhersage besteht darin, die komplexen räumlich-zeitlichen Abhängigkeiten in Verkehrsdaten effektiv zu modellieren. Räumlich-zeitliche Graph Neural Networks (GNNs) sind zu einer der vielversprechendsten Ansätze zur Lösung dieses Problems hervorgetreten. Allerdings weisen GNN-basierte Modelle drei wesentliche Einschränkungen für die Verkehrsprognose auf: i) Die meisten Ansätze modellieren räumliche Abhängigkeiten statisch, was die Fähigkeit zur Erfassung dynamischer Verkehrsverläufe in urbanen Gebieten einschränkt; ii) Die meisten Methoden berücksichtigen ausschließlich kurzfristige räumliche Informationen und können daher langfristige räumliche Abhängigkeiten nicht erfassen; iii) Diese Ansätze ignorieren, dass die Ausbreitung von Verkehrsbedingungen zwischen verschiedenen Orten in realen Verkehrssystemen eine zeitliche Verzögerung aufweist. Um diese Probleme zu adressieren, schlagen wir einen neuartigen, verzögerungs-awareen dynamischen langreichweiten Transformer vor, den wir PDFormer (Propagation Delay-aware dynamic long-range Transformer) nennen. Konkret entwerfen wir ein räumliches Selbst-Attention-Modul, um dynamische räumliche Abhängigkeiten zu erfassen. Anschließend werden zwei Graph-Masking-Matrizen eingeführt, um räumliche Abhängigkeiten aus kurz- und langfristigen Perspektiven hervorzuheben. Darüber hinaus wird ein verzögerungs-awarees Merkmalstransformationsmodul vorgeschlagen, das PDFormer die Fähigkeit verleiht, die zeitliche Verzögerung der räumlichen Informationsausbreitung explizit zu modellieren. Ausführliche experimentelle Ergebnisse auf sechs realen öffentlichen Verkehrsdatensätzen zeigen, dass unsere Methode nicht nur die derzeit beste Leistung erzielt, sondern auch eine konkurrenzfähige Recheneffizienz aufweist. Zudem visualisieren wir die gelernten räumlich-zeitlichen Aufmerksamkeitskarten, um die Interpretierbarkeit unseres Modells zu erhöhen.