要約
視覚的異常検出は、画像内の通常の外観から逸脱する領域の分類または局所化という問題に取り組む。一般的な手法として、異常なし画像上でオートエンコーダーを学習させ、入力画像と再構成画像の差分を計算することで異常検出を行う方法がある。このアプローチは、オートエンコーダーが異常領域を正確に再構成できなくなると仮定している。しかし実際には、ニューラルネットワークは異常に対しても良好な一般化性能を示し、十分な再構成が可能となるため、検出能力が低下する傾向にある。一方で、異常ピクセルがオートエンコーダーに見えない状況では、正確な再構成は極めて困難となる。そこで本研究では、異常検出を自己教師付きの補完による再構成問題として定式化する。提案手法(RIAD)は、画像の部分領域をランダムに除去し、その部分を補完することで画像を再構成する。これにより、従来のオートエンコーダー手法の欠点を克服する。RIADは複数のベンチマークで広範な評価が行われ、最近登場した非常に挑戦的な異常検出ベンチマークにおいて、新たな最先端性能を達成した。