DisCoPatch: OOD検出にはバッチ統計量だけが必要だが、 信頼できる場合に限る

配布外(OOD)検出は多くの応用分野で重要な役割を果たしています。意味的およびドメインシフトのOOD問題はよく研究されていますが、本研究では共変量シフトに焦点を当てています。これは、データ分布の微妙な変動であり、機械学習の性能を低下させる可能性があります。私たちは、これらの微妙なシフトを検出することで、配布内境界の理解を深め、最終的にOOD検出の精度を向上させられるという仮説を立てています。バッチ正規化(Batch Normalization: BN)を使用して訓練された敵対的識別器では、実際のサンプルと敵対的なサンプルが独自のバッチ統計を持つ異なるドメインを形成します。この特性を利用してOOD検出を行うことが可能です。私たちはDisCoPatchという無教師敵対的変分オートエンコーダー(Adversarial Variational Autoencoder: VAE)フレームワークを導入しました。推論時には、同じ画像からのパッチがバッチを構成し、一貫したデータ分布を確保することでモデルがバッチ統計に依存できるようにしています。DisCoPatchは、VAEの非最適な出力(生成および再構築されたもの)を使用して識別器の負例として訓練します。これにより識別器は配布内サンプルと共変量シフトとの境界線引き能力が向上します。この境界を厳密に定義することにより、DisCoPatchは公開されているOOD検出ベンチマークで最先端の結果を達成しています。提案されたモデルは共変量シフトの検出において優れた性能を発揮し、ImageNet-1K(-C)でのAUROC値が95.5%となっています。また、公開されている近傍OOD(Near-OOD)ベンチマーク(95.0%)でもこれまでの方法よりも高い性能を示しています。25MBというコンパクトなモデルサイズで、既存の方法よりも大幅に低いレイテンシーで高精度なOOD検出性能を達成しており、実世界でのOOD検出アプリケーションにとって効率的かつ実用的な解決策となっています。本研究で使用したコードは公開される予定です。