Command Palette
Search for a command to run...
画像内のAttention誘導型異常局所化
画像内のAttention誘導型異常局所化
Shashanka Venkataramanan Kuan-Chuan Peng Rajat Vikram Singh Abhijit Mahalanobis
概要
異常局所化は、産業検査、監視、医療画像診断など多様な応用を持つコンピュータビジョンにおける重要な課題であり、画像内の異常領域を特定することを目的とする。実世界のシナリオでは、異常のサンプル数が少なく、ピクセル単位でのカバー範囲も限られているため、このタスクは困難である。従来の多くは、異常画像を用いてクラス固有の閾値を計算することで異常を局所化していた。本研究では、異常画像を訓練データとして必要としない新たなアプローチとして、ガイド付き注意機構を組み込んだ畳み込み型敵対的変分自己符号化器(Convolutional Adversarial Variational autoencoder with Guided Attention, CAVGA)を提案する。CAVGAは畳み込み型潜在変数を用いることで、空間情報を保持しつつ異常を局所化する。無監督設定では、CAVGAが画像内のすべての正常領域に注目するよう促す「注目拡張損失(attention expansion loss)」を提案する。また、弱教師あり設定では、「補完的ガイド付き注意損失(complementary guided attention loss)」を導入し、正常領域への注目を促す一方で、異常領域に対応する注目マップを最小化するように学習を促進する。CAVGAは、無監督設定下でMVTec異常検出(MVTAD)、改訂版上海技術大学キャンパス(mSTC)、大規模注意機構に基づく緑内障データセット(LAG)において、既存の最先端(SOTA)手法を上回る性能を示した。さらに、弱教師あり設定においてわずか2%の異常画像を用いた場合にも、同様にSOTAを上回った。また、MNIST、CIFAR-10、Fashion-MNIST、MVTAD、mSTC、LAGの各データセットにおいても、異常検出のSOTA手法を上回る結果を達成した。