異常検知異常検知
異常検出とは、データ セット内の予期されるパターンやその他の項目と一致しない項目、イベント、または観察を特定することです。多くの場合、異常項目は銀行詐欺、構造上の欠陥、医療上の問題、テキスト エラー、その他の種類の問題に変わります。
異常検知技術の応用
異常検出テクノロジーは、侵入検出、不正検出、障害検出、システム健全性監視、センサー ネットワーク イベント検出、エコシステム干渉検出など、さまざまな分野で使用されています。前処理中にデータセットから外れ値を削除するためによく使用され、外れ値が削除されたデータセットは教師あり学習の精度を大幅に向上させることができます。
異常検知方法の分類
教師なし異常検出手法では、他のデータとの一致が最も少ないインスタンスを探すことで、ラベルなしのテスト データの異常を検出できます。
教師付き異常検出方法では、「正常」と「異常」のラベルが付けられたデータセットが必要であり、分類器のトレーニングが含まれます。
半教師あり異常検出手法は、指定された通常のトレーニング データセットに基づいて通常の動作を表すモデルを作成し、学習されたモデルによって生成されたテスト インスタンスの可能性を検出します。
- モデルベースの手法: 多くの異常検出手法は、最初にデータ モデルを構築します。異常は、モデルによって完全には適合できないオブジェクトです。
- 近接ベースの手法: 近接測定は通常、オブジェクト間で定義できます。外れ値オブジェクトは他のほとんどのオブジェクトから遠く離れたオブジェクトです。
- 密度ベースの手法: オブジェクトの密度推定は、特にオブジェクト間に近接性の尺度がある場合に、比較的簡単に計算できます。
アプリケーションシナリオ
- 不正行為の検出: カードのセキュリティをチェックする
- 侵入検知: コンピュータ システムへの侵入を検知します。
- 医療分野: 人間の健康を検査する