
要約
拡散モデルは、正常データの分布を捉え、再構成を通じて異常を検出する手法として、異常検出分野において貴重な応用を示している。しかしながら、そのようなモデルは、特に全体的な欠損部品など大規模な異常の局所化において困難を抱えている。この課題に応じ、Mengら(2022)が提案した従来の暗黙的条件付きアプローチを、三つの重要な点で拡張することで、拡散モデルの能力を強化する新たなフレームワークを提示する。第一に、初期の異常予測に基づいて前向きプロセスにおけるノイズ添加ステップ数を動的に調整する手法を導入し、可変なノイズステップを実現する。第二に、追加のノイズを加えずにスケーリングされた入力のみをノイズ除去する手法が、従来のノイズ除去プロセスを上回ることを実証する。第三に、大規模な欠損部品の再構成を妨げる細部情報を抽象化するため、画像を潜在空間に投影するアプローチを採用する。さらに、ターゲットドメインの微細な特徴を効果的に捉えることを可能にする微調整機構を提案する。本手法は、VisA、BTAD、MVTecといった代表的な異常検出データセットにおいて厳密な評価を経ており、優れた性能を示す。特に、異常のスケールにかかわらず、効果的に異常を局所化できることを実証し、拡散モデルを用いた異常検出における画期的な進展を示している。