
現在の多数の分布外(Out-of-Distribution, OOD)検出手法は、特徴量(feature)、ログイット(logit)、またはソフトマックス確率のいずれか一つの入力源に依存している。しかし、OODサンプルの多様性が極めて高いことから、このような手法は脆弱である。特徴空間では容易に識別可能なOODサンプルと、ログイット空間では識別が難しいサンプルが存在し、逆もまた然りである。この観察に着目し、本研究では新たなOODスコアリング手法である「仮想ログイットマッチング(Virtual-logit Matching, ViM)」を提案する。ViMは、クラスに依存しない特徴空間からのスコアと、分布内(In-Distribution, ID)クラスに依存するログイットを統合する。具体的には、主成分空間からの特徴の残差から、仮想のOODクラスを表す追加のログイットを生成し、定数スケーリングによって元のログイットとマッチングさせる。その後、この仮想ログイットにソフトマックスを適用した確率値が、OOD度合いを示す指標となる。学術界における大規模OOD検出の評価を促進するため、ImageNet-1K用に新たなOODデータセットを構築した。このデータセットは人間によるアノテーションが施されており、既存データセットの8.8倍の規模を持つ。CNNおよびビジョントランスフォーマーを含む広範な実験により、提案手法の有効性を検証した。特にBiT-Sモデルを用いた場合、4つの難易度の高いOODベンチマークにおいて平均AUROCが90.91%を達成し、最良のベースラインより4%優れている。コードおよびデータセットは、https://github.com/haoqiwang/vim にて公開されている。