2 个月前
Dinomaly:多类无监督异常检测中的“少即是多”哲学
Guo, Jia ; Lu, Shuai ; Zhang, Weihang ; Chen, Fang ; Li, Huiqi ; Liao, Hongen

摘要
近期的研究强调了一种实用的无监督异常检测(UAD)设置,该设置为多类图像构建了一个统一的模型。尽管在解决这一具有挑战性的任务方面取得了多种进展,但多类设置下的检测性能仍远落后于最先进的类别分离模型。我们的研究旨在弥合这一显著的性能差距。在本文中,我们介绍了一种极简主义的基于重建的异常检测框架,即Dinomaly,该框架利用纯Transformer架构,无需依赖复杂设计、附加模块或专门技巧。通过这一仅由注意力机制和多层感知机组成的强大框架,我们发现了四个对多类异常检测至关重要的简单组件:(1)基础Transformer,用于提取普遍性和区分性特征;(2)噪声瓶颈(Noisy Bottleneck),其中预设的Dropout完成了所有的噪声注入操作;(3)线性注意力(Linear Attention),其天然无法集中注意力;(4)宽松重建(Loose Reconstruction),不强制逐层或逐点重建。我们在多个流行的异常检测基准数据集上进行了广泛的实验,包括MVTec-AD、VisA和Real-IAD。所提出的Dinomaly在三个数据集上的图像级AUROC分别达到了99.6%、98.7%和89.3%,不仅优于最先进的多类UAD方法,还达到了最先进类别分离UAD记录的水平。