LTBoost : Hybrides renforcés d'algorithmes linéaires et de gradient ensemblistes pour la prévision à long terme des séries temporelles
L’évolution des architectures de prévision basées sur l’apprentissage profond est manifeste à travers l’expansion continue de leurs configurations paramétriques. Toutefois, la nécessité d’une prise de décision rapide en temps réel dans des contextes applicatifs réels impose la nécessité d’une stratégie alternative, mettant en évidence la nécessité de réseaux non seulement adaptatifs, mais aussi efficaces dans des opérations en temps réel. Ce changement est crucial face à trois défis majeurs auxquels font face les cadres de prévision basés sur l’apprentissage profond : (i) les limites intrinsèques des transformateurs, dont la nature permutation-invariante des mécanismes d’attention auto-récurrente entraîne inévitablement une perte d’information temporelle, malgré les tentatives visant à préserver l’ordre des données ; (ii) l’inefficacité des modèles linéaires à capturer les interactions dynamiques au sein de signaux évoluant rapidement ; et (iii) l’incapacité des approches basées sur les arbres à extrapoler au-delà des valeurs présentes dans l’ensemble d’apprentissage. En réponse à ces défis, nous introduisons LTBoost, un nouvel algorithme hybride boosté combinant modèles linéaires et arbres de décision, spécifiquement conçu pour les tâches de prévision à long terme des séries temporelles (LTSF), et évolutive à haute dimensionnalité. LTBoost repose sur une stratégie en deux étapes : elle commence par un modèle de régression linéaire pour capter les tendances et extrapoler au-delà des données connues, complétée par un modèle non linéaire robuste basé sur les arbres, qui se concentre sur les résidus. Cette approche hybride boostée ne surmonte pas seulement les limites des modèles existants, mais améliore significativement la précision des prévisions. L’efficacité de LTBoost est validée par des expériences empiriques menées sur neuf jeux de données standardisés, démontrant des performances supérieures et atteignant des résultats de pointe dans 32 cas sur 36, mesurés par l’erreur absolue moyenne (MAE). Nos résultats explorent également l’impact des caractéristiques retardées (lag features) et des techniques de normalisation des signaux, révélant une amélioration supplémentaire de la précision prédictive. Cette approche hybride et hautement efficace met en lumière l’innovation de LTBoost et sa capacité à résoudre des défis spécifiques de prévision, ouvrant ainsi la voie à sa contribution dans le domaine de la prévision des séries temporelles et à son application dans divers scénarios du monde réel.