17 天前

EfficientAD：毫秒级延迟下的高精度视觉异常检测

Kilian Batzner, Lars Heckler, Rebecca König

摘要

在图像中检测异常是一项重要任务，尤其在实时计算机视觉应用中尤为关键。本文聚焦于计算效率，提出了一种轻量级特征提取器，可在现代GPU上以不到一毫秒的时间处理单张图像。随后，我们采用学生-教师（student-teacher）框架来检测异常特征：训练一个学生网络，使其能够预测正常（即无异常）训练图像的特征表示。在测试阶段，当学生网络无法准确预测某图像的特征时，即表明该图像存在异常。为此，我们设计了一种新型训练损失函数，有效抑制学生网络在正常图像之外对教师特征提取器的过度模仿，从而显著降低学生-教师模型的计算开销，同时提升异常特征的检测性能。此外，我们还针对具有挑战性的逻辑异常（logical anomalies）进行了研究，这类异常表现为正常局部特征的非法组合，例如物体排列顺序错误等。我们通过高效集成一个全局分析的自编码器（autoencoder），实现了对这类异常的有效检测。我们在三个工业级异常检测数据集集合中的32个数据集上对所提出的算法——EfficientAD进行了评估。实验结果表明，EfficientAD在异常检测与定位方面均树立了新的基准。在仅2毫秒延迟、每秒处理600张图像的高吞吐量下，该方法实现了对异常的快速响应。结合其极低的误报率，EfficientAD不仅为实际应用场景提供了经济高效的解决方案，也为未来的研究奠定了坚实基础。