17 天前
注意力引导的图像异常定位
Shashanka Venkataramanan, Kuan-Chuan Peng, Rajat Vikram Singh, Abhijit Mahalanobis

摘要
异常定位是计算机视觉领域的一项重要任务,旨在识别图像中的异常区域,广泛应用于工业检测、安防监控和医学影像分析等领域。由于现实场景中异常样本数量稀少且空间覆盖范围有限,该任务具有较大挑战性。以往多数方法依赖异常训练图像来计算特定类别的阈值以实现异常定位。为避免对异常样本的依赖,本文提出一种基于卷积潜变量与引导注意力机制的对抗变分自编码器——Convolutional Adversarial Variational Autoencoder with Guided Attention(CAVGA),该方法通过引入卷积潜变量结构,有效保留了空间信息,从而提升异常定位精度。在无监督设置下,我们设计了一种注意力扩展损失(attention expansion loss),促使CAVGA模型聚焦于图像中的所有正常区域。在弱监督设置下,进一步提出互补引导注意力损失(complementary guided attention loss),在强化模型关注正常区域的同时,最小化对异常区域的注意力响应。实验结果表明,在无监督设置下,CAVGA在MVTec异常检测(MVTAD)、改进版上海科技大学校园数据集(mSTC)以及基于注意力的大规模青光眼数据集(LAG)上均优于当前最先进的异常定位方法。当仅使用2%的异常图像进行训练时,CAVGA在弱监督设置下同样表现卓越。此外,CAVGA在MNIST、CIFAR-10、Fashion-MNIST、MVTAD、mSTC和LAG等多个数据集上,也全面超越了现有的最先进异常检测方法。