
摘要
在图像数据上进行无监督异常检测历来具有不稳定性。我们认为,这一问题的根源在于,许多经典的异常检测方法隐含地假设数据是低维的,然而图像数据本质上是高维的。虽然图像可以被投影到低维嵌入空间,但这类投影依赖于全局变换,往往忽略了细微的变异。由于异常样本本身极为稀少,最终的嵌入表示通常缺乏区分异常与正常样本所必需的关键变异信息。本文提出一种新型嵌入方法,该方法基于一组局部变化的数据投影,其中每个投影专门负责保留能够将局部数据簇与其他所有实例区分开来的变异特征。这种局部可变嵌入确保了能够区分异常的变异得以保留,同时使得每个实例属于某一簇的概率,可以通过与该簇相关联的一维局部投影进行统计推断。通过对实例在各个簇中归属概率的统计聚合,构建出其与整个数据集整体亲和度的全局度量。由此,异常样本便自然浮现出来——表现为亲和度得分显著偏低的实例。