
要約
深層ニューラルネットワークは、未観測のクラスに属するサンプルに対しても高い信頼度を予測する傾向があり、このような場合にこそ専門家の評価を要するべきである。現行の新奇性検出(novelty detection)アルゴリズムは、これらの近接OOD(Out-of-Distribution)サンプルを信頼性高く識別できるわけではないが、それらと類似したラベル付きデータにアクセスできる場合に限っては可能である。本論文では、ラベルなしのID(In-Distribution)データと新奇クラスデータの混合を活用して優れた検出性能を達成する、半教師付き新奇性検出(Semi-Supervised Novelty Detection: SSND)のための新しいアンサンブルベースの手順を提案する。特に、早期停止正則化(early stopping regularization)を用いることで、OODデータ上での予測の不一致(disagreement)のみを誘導する方法を示す。単純なデータ分布に対してこの事実を理論的に証明した上で、広範な実験により、より複雑な状況においても同様の効果が得られることを示唆している。本手法は、標準的な画像データセット(SVHN/CIFAR-10/CIFAR-100)および医療画像データセットにおいて、計算コストのわずかな増加で、最先端のSSND手法を顕著に上回る性能を発揮する。