17日前

異常検出のためのディープアイソレーションフォレスト

Hongzuo Xu, Guansong Pang, Yijie Wang, Yongjun Wang
異常検出のためのディープアイソレーションフォレスト
要約

近年、孤立森(Isolation Forest, iForest)は、さまざまなベンチマークにおいて高い汎用性と優れたスケーラビリティを示すため、最も人気のある異常検出手法の一つとして浮上している。しかし、その線形かつ軸平行な隔離方式は、(i)高次元・非線形分離困難なデータ空間において隔離が困難な難易度の高い異常を検出できないこと、および(ii)アーティファクト領域に対して予期せぬ低異常スコアを割り当てるという著しいアルゴリズム的バイアスを引き起こすことがあり、これらは高い偽陰性誤検出を引き起こす要因となっている。いくつかのiForestの拡張手法が提案されているが、それらは本質的に浅い線形データ分割を採用しており、真の異常を効果的に隔離する能力に制限が生じている。そこで本研究では、深層隔離森(Deep Isolation Forest)を提案する。本手法は、初期化がランダムなニューラルネットワークを用いて元のデータをランダム表現エントリーにマッピングする新しい表現スキームを導入し、その後、その表現空間に対してランダムな軸平行カットを適用してデータの分割を行う。この表現スキームにより、元のデータ空間における分割の自由度が大幅に向上(異なるサイズの部分空間における非線形分割と同等)し、ランダム表現とランダム分割に基づく隔離の間で独自の相乗効果が生じる。広範な実験結果から、本モデルはテーブルデータ、グラフデータ、時系列データの各分野において、最先端の隔離ベース手法および深層検出手法と比較して顕著な性能向上を達成した。また、iForestから引き継いだ望ましいスケーラビリティも維持している。

異常検出のためのディープアイソレーションフォレスト | 最新論文 | HyperAI超神経