17日前
VT-ADL:画像異常検出および局所化のためのビジョントランスフォーマーネットワーク
Pankaj Mishra, Riccardo Verk, Daniele Fornasier, Claudio Piciarelli, Gian Luca Foresti

要約
本稿では、トランスフォーマーに基づく画像異常検出および局所化ネットワークを提案する。提案モデルは、再構成に基づくアプローチとパッチ埋め込みの組み合わせで構成されている。トランスフォーマーネットワークを用いることで、埋め込まれたパッチの空間情報を保持でき、その後、ガウス混合密度ネットワークにより異常領域を局所化する。さらに、実世界の産業用異常データとしてのBTADデータセットも公開する。本研究の成果は、MNISTやMVTecなどの公に利用可能なデータセットを用いて、他の最先端アルゴリズムと比較して評価されている。