11 天前
对比学习在提升分布外检测性能中的应用
Jim Winkens, Rudy Bunel, Abhijit Guha Roy, Robert Stanforth, Vivek Natarajan, Joseph R. Ledsam, Patricia MacWilliams, Pushmeet Kohli, Alan Karthikesalingam, Simon Kohl, Taylan Cemgil, S. M. Ali Eslami, Olaf Ronneberger

摘要
可靠地检测分布外(out-of-distribution, OOD)输入,正逐渐被视为机器学习系统部署的前提条件。本文提出并系统研究了一种基于对比学习(contrastive training)的方法,以提升OOD检测性能。与现有主流OOD检测方法不同,本方法无需依赖显式标注为OOD的样本,而这类样本在实际应用中往往难以获取。通过大量实验验证,我们发现对比学习在多个常用基准测试上显著提升了OOD检测的性能。此外,本文引入并应用了“混淆对数概率”(Confusion Log Probability, CLP)评分,该指标通过衡量正常数据与异常数据之间的相似程度,量化了OOD检测任务的难度。实验结果表明,该方法在“近似分布外”(near OOD)类别上表现尤为突出,而这一场景正是以往方法面临重大挑战的典型情形。