Benchmark HoTPP : Sommes-nous compétents dans la prévision d'événements à horizon long ?

Prédire plusieurs événements futurs dans un horizon temporel donné est essentiel pour des applications en finance, commerce de détail, réseaux sociaux et santé. Les processus ponctuels temporels marqués (MTPP) offrent un cadre rigoureux pour modéliser à la fois les instants d’occurrence et les étiquettes des événements. Toutefois, la plupart des recherches existantes se concentrent uniquement sur la prédiction de l’événement suivant, la prédiction à long terme restant largement sous-explorée. Pour combler ce manque, nous introduisons HoTPP, le premier benchmark spécifiquement conçu pour évaluer de manière rigoureuse les prédictions à long terme. Nous identifions des limites des métriques d’évaluation largement utilisées, proposons une métrique théoriquement fondée, la T-mAP, présentons des baselines statistiques solides, ainsi que des implémentations efficaces de modèles populaires. Nos résultats expérimentaux montrent que les approches modernes basées sur les MTPP sous-performent souvent par rapport à des baselines statistiques simples. Par ailleurs, nous analysons la diversité des séquences prédites et constatons que la plupart des méthodes souffrent d’un phénomène de « collapse des modes ». Enfin, nous étudions l’impact de l’autorégression et des pertes basées sur l’intensité sur la qualité des prédictions, et esquisons des directions prometteuses pour les recherches futures. Le code source HoTPP, les hyperparamètres et les résultats complets d’évaluation sont disponibles sur GitHub.