16日前

産業用異常検出および局所化における弱教師付きリジッドトランスフォーマーの活用

Hanxi Li, Jingqi Wu, Deyin Liu, Lin Wu, Hao Chen, Mingwen Wang, Chunhua Shen
産業用異常検出および局所化における弱教師付きリジッドトランスフォーマーの活用
要約

産業用異常検出(AD)における最近の進展は、学習時に少量の異常サンプルを組み込むことで検出精度が顕著に向上することを示している。しかし、この性能向上はしばしば膨大なアノテーション作業を伴い、多くの実用的応用においては現実的ではない。本論文では、手動アノテーションへの依存を最小限に抑えつつ高精度な異常検出を実現するための新しいフレームワーク、弱教師付きRESidual Transformer(WeakREST)を提案する。まず、画素単位での異常局在タスクをブロック単位の分類問題に再定式化する。次に、異常パターンをより効果的に捉えることができる残差ベースの特徴表現「Positional Fast Anomaly Residuals(PosFAR)」を導入する。この特徴を活用するため、異常検出および局在性能を向上させるためにSwin Transformerを適応した。さらに、バウンディングボックスと画像タグを用いて異常領域を定義する弱教師付きアノテーション手法を提案する。このアプローチにより、ピクセル単位の正確なラベルに依存しなくてもよい半教師付き学習の枠組みが構築され、アノテーション負荷が大幅に軽減される。さらに学習プロセスの改善を図るため、弱ラベルと残差ベース表現の相互作用を適切に扱える新しいResMixMatchアルゴリズムを開発した。MVTec-ADという標準ベンチマークデータセットにおいて、本手法は平均精度(AP)83.0%を達成し、従来の非教師あり設定での最高性能(82.7%)を上回った。教師ありAD設定では、WeakRESTはAP 87.6%を達成し、以前の最良結果(86.0%)を上回った。特に注目すべきは、バウンディングボックスといったより弱いアノテーションを用いても、本手法がピクセル単位のラベルに依存する最先端手法を上回り、AP 87.1%を達成した点である。これは、MVTec-ADにおいて従来の最高性能(86.0%)をも凌駕する結果であり、弱教師付き学習の有効性と本フレームワークの実用性を示している。

産業用異常検出および局所化における弱教師付きリジッドトランスフォーマーの活用 | 最新論文 | HyperAI超神経