
要約
機械学習において、標準的な学習によって得られるモデルは、分布内(ID)データおよび分布外(OOD)データの両方に対して異常に高い信頼度を出力することがよく観察される。したがって、OODサンプルを検出する能力はモデルの実装において極めて重要である。OOD検出のための重要なステップとして、後処理スコアリング(post-hoc scoring)が挙げられる。MaxLogitは、最も大きなログイト(logit)値をOODスコアとして用いるという、最も単純なスコア関数の一つである。本研究では、ログイトに基づくスコア関数を新たな視点から考察するため、ログイトをコサイン類似度とログイトノルムに再定式化し、MaxCosineとMaxNormの使用を提案する。実証的に、MaxCosineがMaxLogitの有効性の中心的な要因であることが明らかになった。一方、MaxNormはMaxLogitの性能を制限する要因となっていることがわかった。この問題に対処するために、MaxCosineとMaxNormのバランスを柔軟に調整できるように設計された「Decoupling MaxLogit(DML)」を提案する。さらに、本手法の本質をより明確に表現するため、より少ないハードサンプルとコンパクトな特徴空間がログイトベース手法の効果を発揮する上で鍵となるという新たな知見に基づき、DMLを拡張したDML+を構築した。本研究では、CIFAR-10、CIFAR-100、ImageNetの各データセット上で、提案するログイトベースOOD検出手法の有効性を実証し、最先端の性能を達成した。