
要約
単一画像からの異常検出は、異常データが常に稀であり、予測不可能な多様なタイプを示すため、困難である。異常を含まないデータのみが利用可能な状況下で、従来の大多数の手法は自動符号化器(AutoEncoder)を用いて入力画像を再構成し、入力と出力の差分を検出して異常領域を特定する。しかし、このような手法には潜在的な問題がある。粗い再構成では不要な画像差分が生じる一方、高精度な再構成では異常部分が誤って再現されてしまう可能性がある。本論文では、この矛盾を解決するため、高精度かつ異常を含まない再構成を生成する二段階アプローチを提案する。本研究で提唱する非教師付き二段階異常検出法(Unsupervised Two-stage Anomaly Detection, UTAD)は、印象抽出器(Impression Extractor, IE-Net)とエキスパートネット(Expert-Net)という二つの技術的要素に基づいている。IE-NetとExpert-Netは、二段階にわたる異常を含まない画像再構成を実現するとともに、直感的に理解可能な中間結果を生成するため、全体のUTADが解釈可能となる。広範な実験の結果、本手法は実世界の異なる物体形状およびテクスチャを有する4つの異常検出データセットにおいて、既存の最先端手法を上回る性能を発揮することが示された。