3ヶ月前

自己教師ありマスク付き畳み込みトランスフォーマーブロックを用いた異常検出

Neelu Madan, Nicolae-Catalin Ristea, Radu Tudor Ionescu, Kamal Nasrollahi, Fahad Shahbaz Khan, Thomas B. Moeslund, Mubarak Shah
自己教師ありマスク付き畳み込みトランスフォーマーブロックを用いた異常検出
要約

近年、異常検出はコンピュータビジョン分野においてますます注目を集めている。その背景には、産業生産ラインにおける製品欠陥検出や、動画監視における異常事象の予測、医療画像における病変の同定など、多岐にわたる応用領域があるためと考えられる。どの分野においても、異常検出は通常、正常なサンプルのみを用いて学習を行う一クラス分類問題として定式化される。この分野で成功を収めている多くの手法は、正常な入力をマスク(例:パッチ、未来のフレームなど)した上でその再構成を学習し、再構成誤差の大きさを異常度の指標とするというアプローチを採用している。他の再構成ベースの手法とは異なり、本研究では、再構成機能をアーキテクチャの核となるレベルに組み込んだ、新たな自己教師付きマスク付き畳み込み変換器ブロック(SSMCTB)を提案する。この提案する自己教師付きブロックは極めて柔軟性に富み、ニューラルネットワークの任意の層で情報をマスク可能であり、幅広いニューラルアーキテクチャと互換性を持つ。本研究では、これまでに提案した自己教師付き予測畳み込み注意ブロック(SSPCAB)を拡張し、3次元マスク付き畳み込み層、チャネルワイズな注意を実現する変換器、およびHuber損失に基づく新たな自己教師付き目的関数を導入した。さらに、本ブロックがRGB画像や監視動画に加え、医療画像および赤外線動画における異常検出というより広範なタスクにも適用可能であることを示した。複数の最先端の異常検出ニューラルモデルにSSMCTBを統合することで、その汎用性と柔軟性を実証し、5つのベンチマークにおいて顕著な性能向上を実証する実証結果を提示した。本研究のコードおよびデータは、オープンソースとして公開しており、以下のURLから入手可能である:https://github.com/ristea/ssmctb。