
要約
我々は、深層ハイブリッドモデル(DHMs)を用いた分布外(OoD)検出のための原理的かつ実用的な手法を提案する。この手法は、一度の順伝播(forward pass)で特徴量とラベルの同時確率分布 ( p(x, y) ) をモデル化する。同時分布 ( p(x, y) ) を3つの不確実性の源に分解することで、訓練データとは意味論的に異なるサンプルを識別する能力を示す。計算上のスケーラビリティを確保するため、訓練中に重み正規化(weight normalization)を導入し、最先端(SoTA)の深層ニューラルネットワーク(DNN)アーキテクチャを容易に統合できるようにすることで、表現力豊かな確率分布の近似および推論が可能となる。本手法は、有望な結果と理論的裏付けを備え、予測不確実性推定において効率的で汎用的かつ柔軟なフレームワークを提供する。知られている限り、本研究は、視覚および言語データセットの両方でOoD検出タスクにおいて100%の性能を達成した初めての取り組みであり、特にCIFAR-10 vs. SVHNやCIFAR-100 vs. CIFAR-10といった極めて困難なデータセット対においても顕著な成果を上げている。本研究は、安全が求められる実世界応用におけるDNNの実用化に向けた重要な一歩である。