17 天前

基于深度特征重构的逻辑与结构化工业异常检测再审视

Sukanya Patra, Souhaib Ben Taieb
基于深度特征重构的逻辑与结构化工业异常检测再审视
摘要

工业异常检测在质量控制与预测性维护中具有重要意义,但由于训练数据有限、异常类型多样以及外部因素导致物体外观变化等挑战,其应用面临诸多困难。现有方法通常通过深度预训练网络提取图像块的多尺度特征,来检测结构性异常(如凹痕、划痕),但此类方法往往对内存和计算资源要求较高,限制了其实际部署。此外,检测逻辑异常(如图像中缺失或多余元素)需要理解物体间的空间关系,而传统基于图像块的方法难以捕捉此类语义信息。针对上述问题,本文聚焦于深度特征重建(Deep Feature Reconstruction, DFR)方法,提出一种内存与计算效率更高的结构性异常检测方案。在此基础上,进一步将DFR扩展为统一框架——ULSAD(Unified Logical and Structural Anomaly Detection),能够同时识别结构性与逻辑性异常。具体而言,我们优化了DFR的训练目标,以提升结构性异常检测的性能;同时引入一种基于注意力机制的损失函数,结合全局自编码器结构的网络,有效建模空间关系,从而实现对逻辑异常的精准检测。在五个基准数据集上的实证评估表明,ULSAD在检测与定位结构性及逻辑性异常方面均显著优于八种当前最先进的方法。广泛的消融实验进一步验证了各模块对整体性能提升的关键贡献。相关代码已开源,地址为:https://github.com/sukanyapatra1997/ULSAD-2024.git