
摘要
异常检测(Anomaly Detection, AD)在工业质检中至关重要,然而现有方法通常依赖于将测试图像与训练集中正常样本进行“比对”。然而,由于外观和位置上的差异,这些正常参考样本往往难以与测试图像准确对齐,从而限制了检测精度。我们观察到,大多数异常表现为局部变化,这意味着即使在异常图像中,仍保留着有价值的正常信息。我们认为,这些信息具有重要价值,且可能与异常区域具有更强的内在一致性,因为异常与正常信息均源自同一图像。因此,我们提出一种新方法——INP-Former,不再依赖训练集提供的外部正常先验,而是直接从测试图像中提取内在正常原型(Intrinsic Normal Prototypes, INPs)。具体而言,我们设计了INP提取器(INP Extractor),通过线性组合图像中的正常特征令牌(tokens)来构建INPs。为进一步确保INPs能够忠实表征测试图像的正常模式,我们提出INP一致性损失(INP Coherence Loss)。随后,基于这些INPs,我们引入INP引导解码器(INP-Guided Decoder),仅对正常令牌进行重建,而重建误差则作为异常得分。此外,我们还设计了软挖掘损失(Soft Mining Loss),在训练过程中优先优化那些较难处理的样本。INP-Former在MVTec-AD、VisA和Real-IAD等多个数据集上,于单类别、多类别及少样本异常检测任务中均取得了当前最优性能,展现出强大的通用性与适应性,成为异常检测领域的一种通用解决方案。尤为突出的是,INP-Former还展现出一定的零样本异常检测能力。相关代码已开源,地址为:https://github.com/luow23/INP-Former。