11日前

ディープな非教師付き異常検出

{Wen-Yan Lin, Siying Liu, Zheng Wang, Tangqing Li}
ディープな非教師付き異常検出
要約

本稿では、完全な教師なし設定下において大規模データセットにおける異常検出を実現する新たな手法を提案する。本手法の核心的なアイデアは、正常データの背後にある表現(representation)を学習することにある。これにより、高次元データを扱うのに適した最新のクラスタリング技術を活用し、正常データの基盤となる信頼性の高い初期選定を可能にする。まず、正常データのサブセットからオートエンコーダを学習し、その後、クラスタリングに基づく正常候補サブセットの仮定と表現学習のプロセスを繰り返し行う。学習されたオートエンコーダからの再構成誤差を用いて、データの正常性を評価するスコア関数を構築する。複数の公開ベンチマークデータセットに対する実験結果から、提案手法は最先端の教師なし手法を上回り、多くの場合で半教師あり手法と同等の性能を達成することが示された。