
摘要
在实际的异常检测(Anomaly Detection, AD)任务中,手动标记异常像素是一项成本高昂的工作。因此,许多异常检测方法被设计为一类分类器,适用于完全不含异常样本的训练集,从而实现更加经济高效的方法。尽管一些开创性研究通过在训练过程中引入真实异常样本展示了更高的异常检测精度,但这种提升是以劳动密集型的标记过程为代价的。本文通过引入ADClick,一种新颖的交互式图像分割(Interactive Image Segmentation, IIS)算法,在异常检测精度和标记成本之间找到了平衡。ADClick利用创新的残差特征和精心设计的语言提示,高效生成真实缺陷图像的“地面真值”异常掩模。值得注意的是,ADClick相比现有的最先进的IIS方法表现出显著更强的泛化能力。作为异常标记工具,ADClick仅需每张训练图像进行3到5次手动点击注释即可生成高质量的异常标签(在MVTec AD数据集上AP = 94.1%)。此外,我们将ADClick的功能扩展至ADClick-Seg,这是一种增强模型,旨在进行异常检测和定位。通过使用ADClick推断出的弱标签对ADClick-Seg模型进行微调,我们在监督式的异常检测任务中建立了最先进水平的表现(在MVTec AD数据集上AP = 86.4%,在KSDD2数据集上AP = 78.4%,PRO = 98.6%)。