
摘要
视觉异常检测广泛应用于工业质量检测领域。本文提出一个全新的数据集以及一种用于ImageNet预训练的新型自监督学习方法,旨在提升在单类(1-class)和双类(2-class)场景下,5-shot、10-shot及高shot(high-shot)训练设置中的异常检测与分割性能。我们发布了名为“视觉异常”(Visual Anomaly, VisA)的数据集,包含10,821张高分辨率彩色图像(其中9,621张为正常样本,1,200张为异常样本),涵盖12种物体在3个不同领域中的图像,是目前规模最大的工业异常检测数据集。该数据集同时提供图像级和像素级标注。此外,本文提出一种新的自监督学习框架——“找不同”(SPot-the-difference, SPD),该框架能够对对比自监督预训练方法(如SimSiam、MoCo和SimCLR)进行正则化,使其更适用于异常检测任务。在VisA和MVTec-AD数据集上的实验结果表明,SPD consistently 提升了各类对比自监督预训练基线方法的性能,甚至超越了监督预训练方法。例如,在双类高shot设置下,SPD相较于SimSiam和监督预训练,分别将异常分割任务的精确率-召回率曲线下面积(AU-PR)提升了5.9%和6.8%。相关项目已开源,访问地址为:http://github.com/amazon-research/spot-diff。