16日前

分布外(OOD)検出の再考:マスク画像モデリングはこれだけで十分である

Jingyao Li, Pengguang Chen, Shaozuo Yu, Zexin He, Shu Liu, Jiaya Jia
分布外(OOD)検出の再考:マスク画像モデリングはこれだけで十分である
要約

分布外(OOD)検出の核となるのは、分布内(ID)サンプルと分布外サンプルを区別できるようなID表現を学習することである。従来の手法は、識別ベースのアプローチを用いてID特徴を学習していたが、これには短絡的な学習(shortcut learning)が生じやすく、包括的な表現の獲得にはつながりにくい傾向があった。本研究では、驚くべきことに、単に再構成ベースの手法を用いるだけで、OOD検出性能が顕著に向上することを発見した。我々はOOD検出の主な要因を深く探求し、再構成ベースの事前学習タスクが、IDデータセットの本質的なデータ分布を学習する上で、一般に適用可能かつ効果的な事前知識(prior)を提供する可能性を明らかにした。具体的には、本研究のOOD検出フレームワーク(MOOD)において、マスク画像モデリング(Masked Image Modeling)を事前学習タスクとして採用した。装飾的な工夫を一切加えず、MOODは、単一クラスOOD検出において従来のSOTAより5.7%、多クラスOOD検出において3.0%、近似分布OOD検出において2.1%の性能向上を達成した。さらに、1クラスあたり10サンプルの異常サンプル暴露(outlier exposure)を用いた手法に対しても、本手法は優れる結果を示したが、これは我々のフレームワークに分布外サンプルを一切用いていないことを踏まえると、特に顕著である。

分布外(OOD)検出の再考:マスク画像モデリングはこれだけで十分である | 最新論文 | HyperAI超神経