
摘要
我们研究了两个相关的问题:检测样本是否被错误分类或属于分布外数据。本文提出了一种简单的基线方法,该方法利用了softmax分布的概率。正确分类的样本通常具有比错误分类和分布外样本更高的最大softmax概率,从而可以实现它们的检测。我们通过定义计算机视觉、自然语言处理和自动语音识别领域的若干任务来评估性能,展示了这一基线方法在所有领域的有效性。此外,我们还表明,有时该基线方法可以被超越,这为未来在这类尚未充分探索的检测任务上的研究提供了空间。
我们研究了两个相关的问题:检测样本是否被错误分类或属于分布外数据。本文提出了一种简单的基线方法,该方法利用了softmax分布的概率。正确分类的样本通常具有比错误分类和分布外样本更高的最大softmax概率,从而可以实现它们的检测。我们通过定义计算机视觉、自然语言处理和自动语音识别领域的若干任务来评估性能,展示了这一基线方法在所有领域的有效性。此外,我们还表明,有时该基线方法可以被超越,这为未来在这类尚未充分探索的检测任务上的研究提供了空间。