17 天前

一次生成,两次利用用于异常检测

Shuyuan Wang, Qi Li, Huiyuan Luo, Chengkan Lv, Zhengtao Zhang
一次生成,两次利用用于异常检测
摘要

视觉异常检测旨在对偏离正常外观的区域进行分类与定位。目前,基于嵌入(embedding-based)的方法和基于重构(reconstruction-based)的方法是该任务的两大主流技术路径。然而,这些方法在工业级检测应用中往往存在效率不足或精度不够的问题。为解决这一挑战,本文提出POUTA(Produce Once Utilize Twice for Anomaly detection),该方法通过复用重构网络中蕴含的判别性信息,同时提升了检测的准确率与效率。我们观察到,重构网络中的编码器与解码器所提取的特征分别能够表征原始图像与重构图像的语义信息。而两者在对称结构下所产生的差异,可提供大致准确的异常区域线索。为进一步优化该线索,POUTA引入了一种自粗至精(coarse-to-fine)的精调机制,利用高层语义表示与监督损失,对每一层判别性特征的语义进行校准。得益于上述模块设计,POUTA具备比现有方法更精确的异常定位能力。此外,通过特征表示的复用机制,POUTA无需在判别网络中重复执行特征提取过程,从而显著减少了模型参数量,提升了计算效率。大量实验结果表明,POUTA在保持更低计算成本的前提下,性能优于或至少可媲美现有先进方法。更为重要的是,POUTA在无需任何特殊设计的情况下,即实现了对当前最先进少样本异常检测方法的超越,充分证明了其在从训练数据中挖掘内在表征能力方面的强大潜力。