
要約
産業分野における異常検出において、異常データの取得が困難であるため、非教師あり異常検出は広く研究されている。特に、外部知識(例えば追加のデータセットや事前学習モデルなど)を利用できない場合、再構成に基づく異常検出手法は実用的な選択肢となる。しかし、再構成ベースの手法は検出性能が低いため、実用上の制限がある。一方、スコアベースモデル(いわゆるノイズ除去拡散モデル)は、近年、生成タスクにおいて高いサンプル品質を示している。本論文では、スコアベースモデルを活用した新しい非教師あり異常検出手法を提案する。この手法は外部知識を用いずに優れた性能を発揮することが期待される。スコアとは対数尤度の勾配であり、異常検出に有用な性質を有している。データ多様体上に存在するサンプルは、ランダムに摂動を加えられた後でも、スコアを用いて即座に復元可能である。これを「スコアベースの摂動耐性」と呼ぶ。一方、多様体から逸脱したサンプルは同様な方法では復元できない。サンプルの位置に応じた耐性の変化は、異常を識別する指標として利用可能である。本研究では、幾何学的視点からこの主張を導出している。提案手法は、産業用異常検出の3つのベンチマークデータセットにおいて優れた性能を示した。特にMVTec ADでは、画像レベルでAUROC 97.7%、ピクセルレベルでAUROC 97.4%を達成し、外部知識を利用しない既存手法を上回った。