17日前
AnomalyDINO:DINOv2を活用したパッチベース少サンプル異常検出の性能向上
Simon Damm, Mike Laszkiewicz, Johannes Lederer, Asja Fischer

要約
マルチモーダル基盤モデルの最近の進展により、少量サンプル(few-shot)異常検出の分野で新たな基準が設定された。本論文では、高品質な視覚特徴のみで既存の最先端の視覚言語モデルと同等乃至優れた性能を達成できるかどうかを検証する。我々は、DINOv2を少量サンプルおよび一サンプル異常検出に適応することで、この可能性を裏付けた。特に産業応用を念頭に置いたアプローチを採用した。その結果、既存手法と同等に留まらず、多くの設定においてそれらを上回ることを示した。本研究で提案する視覚特徴のみを用いるアプローチ、AnomalyDINOは、既に確立されたパッチレベルの深層最近傍(deep nearest neighbor)アプローチに従っており、画像レベルの異常予測とピクセルレベルの異常セグメンテーションの両方を実現可能である。この手法は理論的にシンプルかつトレーニングフリーであり、微調整(fine-tuning)やメタラーニングに追加のデータを必要としない。そのシンプルさにもかかわらず、AnomalyDINOは一サンプルおよび少量サンプル異常検出において最先端の性能を達成しており(例えば、MVTec-ADデータセットにおける一サンプル性能をAUROC 93.1%から96.6%まで向上)、優れた少データ性能を実現している。低コストなオーバーヘッドと優れた少データ性能を兼ね備えたことから、AnomalyDINOは産業現場などにおける迅速な導入に非常に適した候補となる。