CARLA : Apprentissage contrastif auto-supervisé des représentations pour la détection des anomalies dans les séries temporelles

Un défi majeur dans la détection d’anomalies sur les séries temporelles (TSAD) réside dans le manque de données étiquetées dans de nombreux scénarios du monde réel. La plupart des méthodes existantes de détection d’anomalies se concentrent sur l’apprentissage du comportement normal des séries temporelles non étiquetées de manière non supervisée. La frontière du comportement normal est souvent définie de manière trop stricte, ce qui entraîne la classification de légères déviations comme des anomalies, conduisant ainsi à un taux élevé de faux positifs et à une capacité limitée à généraliser les modèles normaux. Pour remédier à ce problème, nous proposons une nouvelle approche d’apprentissage par représentation contrastive auto-supervisée, end-to-end, pour la détection d’anomalies sur les séries temporelles, appelée CARLA (ContrAstive Representation Learning for time series Anomaly detection). Contrairement aux méthodes existantes de learning contrastif, qui supposent que les fenêtres de séries temporelles augmentées sont des exemples positifs et que les fenêtres temporellement éloignées sont des exemples négatifs, nous affirmons que ces hypothèses sont limitées : l’augmentation d’une série temporelle peut en effet la transformer en un exemple négatif, tandis qu’une fenêtre temporellement éloignée peut représenter un exemple positif. Notre approche contrastive exploite les connaissances générales existantes sur les anomalies dans les séries temporelles et intègre divers types d’anomalies comme exemples négatifs. Ainsi, CARLA apprend non seulement le comportement normal, mais aussi les déviations caractéristiques des anomalies. Elle génère des représentations similaires pour des fenêtres temporellement proches, tout en produisant des représentations distinctes pour les anomalies. En outre, elle exploite de manière auto-supervisée les informations relatives aux voisins des représentations pour classifier les fenêtres en fonction de leurs voisins les plus proches ou les plus éloignés, afin d’améliorer davantage la performance de détection d’anomalies. Des tests étendus sur sept grands jeux de données réels de détection d’anomalies sur séries temporelles montrent que CARLA surpasser les méthodes de pointe en apprentissage auto-supervisé et non supervisé pour la TSAD. Notre recherche démontre le potentiel du learning par représentation contrastive pour faire progresser la détection d’anomalies sur les séries temporelles.