HyperAI超神経

配布外の検出

分布外 (OOD) 検出は、機械学習の分野における重要な研究方向であり、モデルのトレーニング段階でカバーされていないデータ サンプルを特定することに焦点を当てています。この検出手法は、特にモデルがトレーニング データとは大きく異なる新しい環境に遭遇する可能性がある場合に、モデルの堅牢性を向上させるために非常に重要です。 OOD 検出の中心的な課題は、モデルが未知のデータや異常なデータに直面したときに、やみくもに予測を行うのではなく、正しく対応できる必要があることです。これらの未知のサンプルは、まったく異なる分布に由来しているか、トレーニング データとは異なる特性を持っている可能性があるため、モデルには特定の一般化機能が必要です。

実際の応用では、OOD 検出には、医療診断、財務リスク評価、自動運転などを含む (ただしこれらに限定されない) 幅広い応用シナリオがあります。これらの領域では、モデルの決定が重大な影響を与える可能性があるため、OOD サンプルを正確に識別して処理できることが特に重要です。たとえば、医療診断では、モデルはトレーニング データには決して現れないまれなケースに遭遇する可能性があり、これらの OOD サンプルを正しく識別できないと、誤った診断が行われる可能性があります。

上海交通大学とアリババ同義研究所が論文「数学的推論における分布外検出のための軌道の埋め込み」は、NeurIPS 2024 に承認されており、数理推論シナリオにおける初の分布外検出の研究結果です。