17日前
GeneralAD:歪み特徴に注目することでドメインを跨ぐ異常検出を実現する手法
Luc P.J. Sträter, Mohammadreza Salehi, Efstratios Gavves, Cees G. M. Snoek, Yuki M. Asano

要約
異常検出の分野において、従来の手法は高レベルの意味的ベンチマークあるいは低レベルの産業用ベンチマークのいずれかにおいて優れた性能を発揮するが、領域間の汎用性を同時に達成することは稀である。意味的異常(semantic anomalies)とは、学習データセットと意味的に異なる新規な事象を指す。たとえば、自動運転車における未観測の物体がこれに該当する。一方、産業的異常(industrial anomalies)は、意味的意味は維持しつつ、微細な欠陥を示すものであり、航空機部品の亀裂などが代表例である。本論文では、意味的状況、近似分布状況、産業的状況の3つの設定において、タスク毎の最小限の調整で動作可能な異常検出手法「GeneralAD」を提案する。本手法では、画像パッチを入力として学習されるビジョントランスフォーマー(Vision Transformers)の固有の構造的特性に着目し、最終隠れ状態がパッチベースの構造を保持することを活用する。さらに、ノイズ追加やパッチ特徴のシャッフルといったシンプルな操作を用いて、擬似異常サンプルを生成する新たな自己教師型異常生成モジュールを提案する。生成された特徴は、画像内の各パッチを評価するアテンションベースの識別器に供給され、学習される。このアプローチにより、画像レベルでの異常検出精度を高めるとともに、解釈可能な異常マップの生成も可能となる。我々は10のデータセット上で広範な評価を実施し、異常検出および局所化の両タスクにおいて、6つのデータセットで最先端の性能を達成し、残りのデータセットでは同等の性能を示した。