
要約
従来の無監督産業異常検出に関する研究は、主に亀裂や色の不均一といった局所的な構造的異常に注目していた。このような異常に対しては著しく高い検出性能を達成しているが、物体が誤った位置に配置されるなど、長距離依存関係を破る論理的異常の検出には苦慮している。本論文では、従来の知識蒸留(knowledge distillation)の研究成果を踏まえ、教師モデルの挙動をより正確に再現するために、局所的特徴を捉える「局所的生徒」と、論理的異常に注目する「グローバル生徒」の2つの生徒モデルを導入する手法を提案する。従来の研究で主に用いられてきた局所的生徒は構造的異常の検出に特化しているのに対し、グローバル生徒は長距離依存関係を捉えることに重点を置く。さらに、グローバル生徒が長距離依存関係を効果的に学習できるよう、グローバルコンテキスト圧縮ブロック(Global Context Condensing Block, GCCB)を設計し、生徒モデルの訓練および異常スコアリングに向けたコンテキスト類似性損失(contextual affinity loss)を提案する。実験結果から、本手法は煩雑な訓練技術を必要とせず、MVTec LOCO ADデータセットにおいて新たな最先端の性能を達成することが明らかになった。