Évaluation des algorithmes de détection d'anomalies en temps réel - la Benchmark de Détection d'Anomalies Numenta

Une grande partie des données du monde est constituée de données en flux, de séries temporelles, où les anomalies fournissent des informations significatives dans des situations critiques ; des exemples abondent dans des domaines tels que la finance, l'informatique, la sécurité, la médecine et l'énergie. Cependant, détecter les anomalies dans les données en flux est une tâche difficile, nécessitant que les détecteurs traitent les données en temps réel, et non par lots, tout en apprenant et en faisant des prédictions simultanément. Il n'existe pas de référentiels permettant d'évaluer adéquatement et de mesurer l'efficacité des détecteurs d'anomalies en temps réel. Dans ce contexte, nous proposons le Numenta Anomaly Benchmark (NAB), qui vise à offrir un environnement contrôlé et reproductible d'outils open source pour tester et évaluer les algorithmes de détection d'anomalies sur des données en flux. Le détecteur idéal serait capable de détecter toutes les anomalies dès que possible, ne déclencherait aucune fausse alarme, fonctionnerait avec des données de séries temporelles du monde réel provenant d'une variété de domaines, et s'adapterait automatiquement aux statistiques changeantes. Ces caractéristiques sont formalisées dans le NAB, grâce à un algorithme de notation conçu spécifiquement pour les données en flux. Le NAB évalue les détecteurs sur un ensemble de référence composé de données de séries temporelles du monde réel étiquetées. Nous présentons ces composants et fournissons des résultats et analyses pour plusieurs algorithmes open source utilisés commercialement. L'objectif du NAB est de fournir un cadre standard et open source permettant à la communauté scientifique de comparer et d'évaluer différents algorithmes pour la détection d'anomalies dans les données en flux.