11日前

SSD:自己教師あり外れ値検出のための統一枠組み

Vikash Sehwag, Mung Chiang, Prateek Mittal
SSD:自己教師あり外れ値検出のための統一枠組み
要約

以下の問いを提起する:分布外(Out-of-Distribution, OOD)サンプル、すなわち学習分布から大きく離れたサンプルを検出するためには、どのような学習情報が必要となるのか?多くの応用においてラベルなしデータは容易に入手可能であるため、最も魅力的なアプローチは、ラベルなしの分布内(in-distribution)データのみを用いて検出器を構築することである。しかしながら、我々は、現在のラベルなしデータに基づく大多数の検出器が低性能であることを観察した。実際、これらの検出器はしばしばランダム予測と同等の性能にとどまる。一方で、現在の最先端のOOD検出器は、教師あり学習に必要な細かいラベル付きデータを用いることで、非常に優れた性能を達成している。本研究では、ラベルなしの分布内データのみを用いて構築可能な異常値検出器「SSD(Self-supervised Outlier Detection)」を提案する。本手法は、自己教師学習(self-supervised representation learning)を用いて特徴表現を学習し、その後、特徴空間上でマハラノビス距離(Mahalanobis distance)に基づく検出を行う。実験により、SSDはラベルなしデータに基づく既存の多数の検出器を大幅に上回ることを示した。さらに、SSDは教師あり学習に基づく検出器と同等、あるいは場合によってはそれ以上に優れた性能を達成している。最後に、本検出フレームワークを二つの重要な拡張により拡張した。第一に、少サンプルOOD検出(few-shot OOD detection)を定式化し、対象となるOODデータセットの各クラスから1~5サンプルのみを検出器が利用可能とする設定を想定した。第二に、利用可能な場合、訓練データのラベルをフレームワークに組み込む拡張を実施した。これらの拡張により、SSDを基盤とする本新規検出フレームワークは性能が向上し、最先端の性能を達成することを確認した。本研究のコードは、公開されている:https://github.com/inspire-group/SSD。

SSD:自己教師あり外れ値検出のための統一枠組み | 最新論文 | HyperAI超神経