17 天前
DROCC:深度鲁棒一类分类
Sachin Goyal, Aditi Raghunathan, Moksh Jain, Harsha Vardhan Simhadri, Prateek Jain

摘要
针对一类分类问题的传统方法,如一类支持向量机(One-Class SVM)和孤立森林(Isolation Forest),在应用于图像等结构化数据领域时,通常需要精心设计特征工程。当前最先进的方法致力于利用深度学习,通过两种主要途径自动学习合适的特征表示。第一种方法基于预测数据变换(Golan & El-Yaniv, 2018;Hendrycks et al., 2019a),尽管在某些领域表现良好,但其性能高度依赖于特定领域合适的变换集合,而这类变换在一般情况下难以获取。第二种方法则是在学习到的最终层特征表示上最小化经典的一类损失函数,例如 DeepSVDD(Ruff et al., 2018),然而该方法存在根本性缺陷——特征表示坍缩(representation collapse)问题。在本工作中,我们提出了深度鲁棒一类分类方法(Deep Robust One-Class Classification, DROCC),该方法无需任何辅助信息,适用于大多数标准数据域,并对特征表示坍缩具有强鲁棒性。DROCC 的核心假设是:目标类别中的样本点位于一个充分采样、局部线性且低维的流形上。实证评估表明,DROCC 在两种不同类型的一类问题设置下均表现出色,并在多个跨领域的现实世界数据集上验证了其有效性,涵盖表格数据、图像(CIFAR 和 ImageNet)、音频以及时间序列数据。在异常检测任务中,DROCC 相较于现有最先进方法,准确率最高可提升达 20%。代码已开源,地址为:https://github.com/microsoft/EdgeML。