
要約
既存の異常検出研究の多くは、正常な訓練サンプルの存在を前提としているが、実世界の多くの応用場面では、少数のラベル付き異常サンプルも実際に利用可能である。たとえば、ランダムな品質検査において特定された欠陥サンプルや、日常的な医療スクリーニングにおいて放射線科医によって確認された病変画像などが該当する。これらの異常サンプルは、特定の応用分野における異常の性質について貴重な知識を提供し、近年の一部のモデルでは、類似した異常の検出性能が著しく向上している。しかし、訓練中に観測される異常は、すべての可能な異常クラスを網羅しているわけではないため、未知の異常クラスへの一般化能力が乏しくなるという課題がある。本論文では、既知の異常(「グレイ・スワン」)と未知の異常(「ブラック・スワン」)の両方を検出することを目的として、開集合設定における教師あり異常検出に取り組む。我々は、既知の異常、仮想異常(pseudo anomalies)、および潜在的残差異常(latent residual anomalies、すなわち潜在空間における正常データと比べて異常に大きな残差を持つサンプル)の分離表現を学習する新たなアプローチを提案する。特に、後二者は未知の異常を検出するための設計を施している。9つの実世界の異常検出データセットを用いた広範な実験により、様々な設定下で既知および未知の異常の検出において、本モデルが優れた性能を発揮することが示された。コードおよびデータは以下のURLで公開されている:https://github.com/choubo/DRA。