
摘要
准确识别测试样本是否属于分类器训练集中某一语义类别,对于模型的实际部署至关重要。这一任务被称为开放集识别(Open-Set Recognition, OSR),近年来受到广泛关注。本文首先证明,分类器做出“以上皆非”(none-of-above)判断的能力与其在封闭集类别上的准确率高度相关。这一关系在不同损失函数目标和网络架构下均成立,并在标准OSR基准测试以及大规模ImageNet评估中得到进一步验证。其次,我们利用这一相关性,通过提升封闭集分类准确率来增强基于最大logit分数的OSR“基线方法”的性能,从而在多个OSR基准上取得了当前最优(state-of-the-art)结果。类似地,我们通过提升现有最优方法的封闭集准确率也实现了性能提升,但其与该强基线之间的差距微乎其微。本文第三项贡献是提出“语义偏移基准”(Semantic Shift Benchmark, SSB),该基准更贴合检测语义新颖性的实际任务,相较于其他相关研究中常见的分布外检测(out-of-distribution detection)等分布偏移形式更具合理性。在该新评估框架下,我们再次验证了强基线方法与现有最优方法之间几乎不存在性能差异。项目主页:https://www.robots.ox.ac.uk/~vgg/research/osr/