
産業用異常検出は品質管理および予知保全において極めて重要であるが、限られたトレーニングデータ、多様な異常タイプ、および物体の外観を変化させる外部要因の存在により、課題を抱えている。従来の手法は、深層事前学習ネットワークを用いて画像パッチを抽出し、そのマルチスケール特徴を活用することで、へこみや傷といった構造的異常を検出するものが一般的である。しかし、これらの手法は大きなメモリおよび計算リソースを要するため、実用的な応用が制限される場合が多い。さらに、欠落または過剰な要素を含む画像といった論理的異常の検出には、空間的関係性の理解が不可欠であるが、従来のパッチベース手法ではこれを捉えきれない。本研究では、構造的異常検出に向けたメモリおよび計算効率に優れたDeep Feature Reconstruction(DFR)に着目し、その限界を克服する。さらに、DFRを拡張し、構造的異常と論理的異常の両方を検出可能な統一フレームワークであるULSAD(Unified Logical and Structural Anomaly Detection)を提案する。具体的には、構造的異常検出の性能向上を目指してDFRのトレーニング目的を改良するとともに、グローバルなオートエンコーダー型ネットワークを用いたアテンションベースの損失機構を導入し、論理的異常の検出に対応する。5つのベンチマークデータセットにおける実証評価により、ULSADが構造的および論理的異常の両方を検出・局所化する能力において、8つの最先端手法を上回ることを示した。さらに、包括的なアブレーションスタディにより、各モジュールが全体的な性能向上に果たす寄与が明確に示された。本研究のコードは、https://github.com/sukanyapatra1997/ULSAD-2024.git にて公開されている。