17日前
GLAD:教師なし異常検出におけるグローバルかつローカルな適応型拡散モデルを用いたより優れた再構成へ
Hang Yao, Ming Liu, Haolin Wang, Zhicun Yin, Zifei Yan, Xiaopeng Hong, Wangmeng Zuo

要約
拡散モデル(Diffusion models)は、教師なし異常検出タスクにおいて優れた性能を示している。これらのモデルは正常データのみで訓練されるため、テスト画像に対してノイズを加えた正常な再構成結果を生成する傾向がある。しかし、従来の手法はすべての潜在的な異常を同等に扱うため、主に二つの問題が生じる。まず、グローバルな視点から見ると、異なる異常を含む画像の再構成難易度は不均一である。したがって、すべてのサンプルに同一の設定を適用するのではなく、拡散モデルから抽出された事前知識(prior)と画像コンテンツとの差異を評価することで、各サンプルに対して個別に適切なノイズ除去ステップを予測する手法を提案する。次に、ローカルな視点から見ると、同一画像内でも異常領域と正常領域の再構成は異なる。理論的には、拡散モデルは各ステップごとに標準正規分布に従うノイズを予測するが、異常とその潜在的な正常対応物との間に差異があるため、異常領域における予測ノイズは必然的に標準正規分布から逸脱する。これを解決するために、訓練段階で合成された異常サンプルを導入し、拡散モデルが標準正規分布の制約を越えるように促進する。また、推論段階では空間適応型の特徴融合スキームを用いる。上記の改良を統合することで、グローバルかつローカルに適応可能な拡散モデル(略称:GLAD)を提案する。このモデルは、異常を再構成せずに正常情報の保持を最大化しつつ、高い柔軟性を実現する。提案手法の有効性を、一般的に用いられる3つの異常検出データセット(MVTec-AD、MPDD、VisA)および本研究が統合したプリント回路基板データセット(PCB-Bank)において広範な実験を通じて検証した。