
要約
半教師あり枠組みの下で、産業製品の表面欠陥検出を目的として、エンドツーエンド型のメモリベース分類ネットワーク(MemSeg)を提案する。同一生産ラインにおける製品のクラス内変動が小さいことを考慮し、差異と共通性の観点から、MemSegは人工的にシミュレートされた異常サンプルとメモリサンプルを導入し、ネットワークの学習を支援する。学習段階では、MemSegは正常画像とシミュレートされた異常画像の潜在的な差異を明示的に学習することで、堅牢な分類ハイパープレーンを獲得する。同時に、人間の記憶メカニズムに着想を得て、MemSegは正常サンプルの一般化されたパターンを格納するメモリプールを用いる。入力サンプルとメモリプール内のメモリサンプルとの類似性と差異を比較することで、異常領域に対する効果的な推測を行う。推論段階では、MemSegはエンドツーエンドのアプローチにより、入力画像の異常領域を直接判定する。実験による検証の結果、MemSegはMVTec ADデータセットにおいて、画像レベルとピクセルレベルでそれぞれ99.56%および98.84%というAUCスコアを達成し、最先端(SOTA)の性能を示した。さらに、エンドツーエンドかつシンプルなネットワーク構造により、推論速度に顕著な優位性を発揮し、産業現場におけるリアルタイム要件をより適切に満たしている。