17日前

VT-ADL:画像異常検出および局所化のためのビジョントランスフォーマーネットワーク

Pankaj Mishra, Riccardo Verk, Daniele Fornasier, Claudio Piciarelli, Gian Luca Foresti
VT-ADL:画像異常検出および局所化のためのビジョントランスフォーマーネットワーク
要約

本稿では、トランスフォーマーに基づく画像異常検出および局所化ネットワークを提案する。提案モデルは、再構成に基づくアプローチとパッチ埋め込みの組み合わせで構成されている。トランスフォーマーネットワークを用いることで、埋め込まれたパッチの空間情報を保持でき、その後、ガウス混合密度ネットワークにより異常領域を局所化する。さらに、実世界の産業用異常データとしてのBTADデータセットも公開する。本研究の成果は、MNISTやMVTecなどの公に利用可能なデータセットを用いて、他の最先端アルゴリズムと比較して評価されている。

VT-ADL:画像異常検出および局所化のためのビジョントランスフォーマーネットワーク | 最新論文 | HyperAI超神経