13日前

MOS:大規模な意味空間における分布外検出のスケーラビリティ向上へ

Rui Huang, Yixuan Li
MOS:大規模な意味空間における分布外検出のスケーラビリティ向上へ
要約

実世界における機械学習モデルの安全な導入において、「分布外(Out-of-Distribution: OOD)入力の検出」は中心的な課題である。従来の解決策は、主に小規模なデータセット(例えばCIFAR)に基づいており、解像度が低く、クラスラベル数も非常に少ないという制約がある。その結果、大規模な画像分類タスクにおけるOOD検出は、依然としてほとんど未開拓の領域にとどまっている。本論文では、グループベースのOOD検出フレームワークと、新たなOODスコアリング関数として「MOS(Mean-Optimized Score)」を提案することで、この重要なギャップを埋める。我々の核心的なアイデアは、大規模な意味空間を類似した概念を持つ小さなグループに分解することで、分布内(in-distribution)と分布外データの間の決定境界を簡素化し、効果的なOOD検出を実現することである。従来の手法と比較して、高次元クラス空間において大幅にスケーラビリティが向上している。ImageNetで学習されたモデルを、多様な意味構造をカバーする4つの精選されたOODデータセットに対して評価した結果、MOSは最先端の性能を達成し、従来の最良手法と比較して平均FPR95(False Positive Rate at 95% True Positive Rate)を14.33%低減するとともに、推論速度で6倍の高速化を実現した。