HyperAIHyperAI
il y a 17 jours

AER : Auto-Encoder avec Régression pour la Détection des Anomalies dans les Séries Temporelles

Lawrence Wong, Dongyu Liu, Laure Berti-Equille, Sarah Alnegheimish, Kalyan Veeramachaneni
AER : Auto-Encoder avec Régression pour la Détection des Anomalies dans les Séries Temporelles
Résumé

La détection d’anomalies sur des séries temporelles devient de plus en plus courante dans divers domaines industriels qui surveillent des métriques afin de prévenir des accidents potentiels et des pertes économiques. Toutefois, la rareté des données étiquetées ainsi que les définitions floues des anomalies compliquent ces efforts. Les méthodes récentes d’apprentissage non supervisé ont réalisé des progrès significatifs pour aborder ce problème, en s’appuyant soit sur des prédictions ponctuelles, soit sur la reconstruction de séries temporelles. Bien que traditionnellement traitées de manière séparée, ces approches ne sont pas mutuellement exclusives et peuvent offrir des perspectives complémentaires pour la détection d’anomalies. Ce papier met d’abord en évidence les réussites et les limites des méthodes basées sur la prédiction et celles basées sur la reconstruction, à l’aide de signaux de séries temporelles visualisés et de scores d’anomalie. Nous proposons ensuite AER (Auto-encodeur avec Régression), un modèle conjoint qui combine un auto-encodeur classique et un régresseur LSTM afin d’intégrer les forces de chaque méthode tout en surmontant leurs faiblesses. Notre modèle permet de produire des prédictions bidirectionnelles tout en reconstruisant simultanément la série temporelle d’origine, en optimisant une fonction objectif conjointe. Par ailleurs, nous proposons plusieurs stratégies pour combiner les erreurs de prédiction et de reconstruction, à travers une série d’études d’ablation. Enfin, nous comparons les performances de l’architecture AER à deux méthodes basées sur la prédiction et trois méthodes basées sur la reconstruction sur 12 jeux de données univariés bien connus provenant de NASA, Yahoo, Numenta et UCR. Les résultats montrent qu’AER obtient le score F1 moyen le plus élevé sur l’ensemble des jeux de données (amélioration de 23,5 % par rapport à ARIMA), tout en conservant un temps d’exécution similaire à celui de ses composants d’auto-encodeur classique et de régresseur. Notre modèle est disponible dans Orion, un outil open source de benchmarking pour la détection d’anomalies sur les séries temporelles.