11日前

分布外データの検出における分布内クラス事前分布を用いた手法

{Bo Han, Feng Zheng, Tongliang Liu, Hong Chen, Zhen Fang, Feng Liu, Xue Jiang}
分布外データの検出における分布内クラス事前分布を用いた手法
要約

事前に訓練された分布内(ID)モデルを用いた推論時における分布外(OOD)検出は、推論段階でOODデータを識別することを目的としている。しかし、いくつかの代表的な手法は、OODデータがすべてのIDクラスに属する確率が等しいという未検証の仮定を共有している。すなわち、これらのOODからIDへの確率は実際には一様分布を形成すると仮定している。本論文では、この仮定がIDモデルのクラス不均衡なデータによる学習において、上述の手法が機能不能となる原因であることを示す。幸いなことに、ID/OODクラスと特徴量の因果関係を分析することで、OODからIDへの確率がIDクラス事前確率分布に従うと期待される一般的な状況を特定し、既存の推論時検出手法を修正するための2つの戦略を提案する。1)一様分布を明示的に使用している場合、その一様分布をIDクラス事前確率分布に置き換えること;2)そうでない場合、事前訓練モデルのソフトマックス出力とIDクラス事前確率分布との類似性に基づいてスコアを再重み付けすること。広範な実験により、IDモデルが不均衡なデータで事前学習されている場合でも、これらの戦略がOOD検出性能を向上させることを確認した。これは、OOD検出においてIDクラス事前確率の重要性を示している。

分布外データの検出における分布内クラス事前分布を用いた手法 | 最新論文 | HyperAI超神経