17 天前

EfficientAD:毫秒级延迟下的高精度视觉异常检测

Kilian Batzner, Lars Heckler, Rebecca König
EfficientAD:毫秒级延迟下的高精度视觉异常检测
摘要

在图像中检测异常是一项重要任务,尤其在实时计算机视觉应用中尤为关键。本文聚焦于计算效率,提出了一种轻量级特征提取器,可在现代GPU上以不到一毫秒的时间处理单张图像。随后,我们采用学生-教师(student-teacher)框架来检测异常特征:训练一个学生网络,使其能够预测正常(即无异常)训练图像的特征表示。在测试阶段,当学生网络无法准确预测某图像的特征时,即表明该图像存在异常。为此,我们设计了一种新型训练损失函数,有效抑制学生网络在正常图像之外对教师特征提取器的过度模仿,从而显著降低学生-教师模型的计算开销,同时提升异常特征的检测性能。此外,我们还针对具有挑战性的逻辑异常(logical anomalies)进行了研究,这类异常表现为正常局部特征的非法组合,例如物体排列顺序错误等。我们通过高效集成一个全局分析的自编码器(autoencoder),实现了对这类异常的有效检测。我们在三个工业级异常检测数据集集合中的32个数据集上对所提出的算法——EfficientAD进行了评估。实验结果表明,EfficientAD在异常检测与定位方面均树立了新的基准。在仅2毫秒延迟、每秒处理600张图像的高吞吐量下,该方法实现了对异常的快速响应。结合其极低的误报率,EfficientAD不仅为实际应用场景提供了经济高效的解决方案,也为未来的研究奠定了坚实基础。