
要約
世界の多くのデータはストリーミング、時系列データであり、異常検知が重要な状況下で有意義な情報を提供します。金融、IT、セキュリティ、医療、エネルギーなどの分野では、このような例が数多く見られます。しかし、ストリーミングデータにおける異常検知は困難な課題であり、検知器はリアルタイムでデータを処理し(バッチ処理ではなく)、予測を行う的同时に学習する必要があります。現実には、リアルタイム異常検知器の効果を適切にテストおよび評価するためのベンチマークが存在していません。本稿では、Numenta Anomaly Benchmark (NAB) を提案します。NAB はオープンソースツールを使用した制御可能かつ再現性のある環境を提供し、ストリーミングデータに対する異常検知アルゴリズムのテストと測定を行います。理想的な検知器は以下の特性を持つべきです:可能な限り早くすべての異常を検出すること、誤報を発生させないこと、さまざまな分野での実世界の時系列データに対応すること、そして統計情報の変化に自動的に適応すること。これらの特性を評価するために NAB では、ストリーミングデータ向けに設計されたスコアリングアルゴリズムが形式化されています。NAB はラベル付きの実世界の時系列データセットを使用して検知器を評価します。本稿ではこれらの構成要素について説明し、いくつかのオープンソースで商用利用されているアルゴリズムの結果と分析を示します。NAB の目標は、研究コミュニティが異なるアルゴリズムを比較・評価できる標準的なオープンソースフレームワークを提供することです。これによりストリーミングデータにおける異常検知に関する研究が促進されると期待されます。