
要約
分布外(Out-of-Distribution, OOD)検出のタスクは、機械学習モデルを実世界の環境に導入する上で極めて重要である。本論文では、分布内(In-Distribution, ID)特徴とOOD特徴の特徴量行列の特異値分布が著しく異なることに着目した。具体的には、OOD特徴行列はID特徴と比較して、より大きな主要な特異値を有しており、その特異値と対応する特異ベクトルから構成されるランク1行列が、OODサンプルのクラス予測の大部分を決定していることが明らかになった。この観察に基づき、我々は高レベル特徴(すなわち $\mathbf{X} - \mathbf{s}{1}\mathbf{u}{1}\mathbf{v}_{1}^{T}$)から最大特異値および対応する特異ベクトルからなるランク1行列を除去する、シンプルかつ効果的な「事後的(post hoc)」OOD検出手法である \texttt{RankFeat} を提案する。\texttt{RankFeat} は、従来の最良手法と比較して平均的な偽陽性率(FPR95)を17.90%低減し、現在の最先端(state-of-the-art)性能を達成した。また、実験結果を裏付けるため、広範なアブレーションスタディおよび包括的な理論的解析も提示している。