産業用表面異常検出におけるエッジ画像からの再構成と色および勾配差の組み合わせ

再構成ベースの手法は、産業用視覚異常検出において広く研究されている。このような手法は、通常パターンを良好に再構成するが、異常パターンでは再構成に失敗するようにモデルを設計することが一般的であり、その結果、再構成誤差を評価することで異常を検出する。しかし実際には、モデルの一般化境界を正確に制御することが難しい。一般化能力が強すぎるモデルは、異常領域でさえ良好に再構成してしまうため、異常と通常パターンの区別が困難になり、逆に一般化能力が弱いモデルは、通常領域に含まれる変動性の高い高周波成分を再構成できず、偽陽性を引き起こす。上記の課題に対処するため、本研究では、元のRGB画像をそのグレースケールエッジから再構成する新たな再構成ネットワーク(EdgRec)を提案する。具体的には、スキップ接続を備えたUNet型のノイズ除去オートエンコーダを用いて実現している。入力としてのエッジ情報とスキップ接続により、元画像に含まれる高周波情報を効果的に保持できる。同時に、提案する再構成タスクは、ネットワークが通常パターンの低周波成分および色情報のみを記憶することを促す。さらに、ノイズ除去設計により、モデルが元の高周波成分を直接コピーするのを防ぐことができる。異常の評価のため、色差と勾配差の両方を考慮した解釈可能性に優れた手動設計評価関数を新たに提案する。本手法は、挑戦的なベンチマークMVTec ADにおいて、検出性能97.8%、局所化性能97.7%(AUROC)という競争力のある結果を達成した。さらに、MVTec 3D-ADデータセット上でもRGB画像のみを用いた実験を行い、信頼性の高い結果を示した。本研究のコードは、https://github.com/liutongkun/EdgRec にて公開予定である。