17日前

異常検出のためのインペインティングトランスフォーマー

Jonathan Pirnay, Keng Chai
異常検出のためのインペインティングトランスフォーマー
要約

コンピュータビジョンにおける異常検出は、正常な画像群から逸脱する画像を識別するタスクである。一般的なアプローチとして、深層畳み込みオートエンコーダを用いて画像の被覆領域を補完し、その出力結果と元の画像を比較する方法がある。異常のないサンプルのみで学習を行うことで、モデルは異常領域を適切に再構成できず、その結果として異常を検出できると仮定される。本研究では、画像の遠方領域からの情報を組み込むことが、補完に基づく異常検出において有益であると提案する。特に、異常検出をパッチ補完問題として定式化し、畳み込みを一切排除した純粋に自己注意(self-attention)に基づくアプローチを提案する。提案する「Inpainting Transformer(InTra)」は、大規模な画像パッチの系列に対して被覆されたパッチを補完するように学習され、入力画像の広範囲にわたり情報を統合する能力を持つ。スクラッチからの学習において、追加の学習データを用いない他の手法と比較して、MVTec ADデータセットにおける異常検出では最先端の性能と同等の結果を達成し、異常領域のセグメンテーションではそれらを上回る性能を示した。

異常検出のためのインペインティングトランスフォーマー | 最新論文 | HyperAI超神経