2ヶ月前
階層ベクトル量子化トランスフォーマーを用いた多クラス非教師異常検出
Lu, Ruiying ; Wu, YuJie ; Tian, Long ; Wang, Dongsheng ; Chen, Bo ; Liu, Xiyang ; Hu, Ruimin

要約
非監督画像異常検出(Unsupervised Image Anomaly Detection: UAD)は、正常サンプルの堅牢で判別的な表現を学習することを目指しています。クラスごとの個別の解決策は高コストの計算と限定的な汎化能力をもたらすため、本論文では複数クラスに対する統一的なフレームワークの構築に焦点を当てています。このような困難な設定下では、連続的な潜在表現を前提とする一般的な再構成ベースのネットワークは常に「同一ショートカット」問題に悩まされます。この問題では、正常および異常サンプルがともに良好に再構成され、区別するのが難しくなります。この重要な課題に対処するため、我々は確率的フレームワークのもとで階層的なベクトル量子化プロトタイプ指向のTransformerを提案します。まず、連続的な表現を学習する代わりに、典型的な正常パターンを離散的な象徴的なプロトタイプとして保存し、モデルがショートカットに陥ることを防ぐためにベクトル量子化の重要性を確認します。次に、ベクトル量子化された象徴的プロトタイプは再構成のためにTransformerに統合され、異常データポイントが正常データポイントに変換されるようにします。第二に、コードブック崩壊問題の緩和と脆弱な正常パターンの補完のために精緻な階層的フレームワークを探求します。第三に、プロトタイプ指向の最適輸送方法を提案し、プロトタイプの規制を改善し、階層的に異常スコアを評価します。MVTec-ADおよびVisAデータセットでの評価により、我々のモデルは最先端の代替手法を超えており、高い解釈可能性を持っています。コードは以下のURLから入手可能です:https://github.com/RuiyingLu/HVQ-Trans。