15日前
敵対的攻撃を防止するための統合型Auto Encoder-Block Switching防御手法
Anirudh Yadav, Ashutosh Upadhyay, S.Sharanya

要約
最近の研究によると、最先端のニューラルネットワークが adversarial(敵対的)な入力サンプルに対して示す脆弱性は著しく増大している。ニューラルネットワークとは、機械学習アルゴリズムを用いてコンピュータがタスクを学習するための中間的手法または技術である。機械学習および人工知能(AI)モデルは、自動運転車[1]やスマートホームデバイスなど、現代社会の基盤的な要素となりつつある。そのため、いかなる脆弱性も重大な懸念事項となる。わずかな入力のずれさえも、こうした極めて厳密なシステムを欺き、ユーザーおよび管理者を危険な状況に陥れる可能性がある。本稿では、自動符号化器(auto-encoder)[3]とブロックスイッチングアーキテクチャを組み合わせた防御アルゴリズムを提案する。自動符号化器は、入力画像に含まれる摂動(ノイズや歪み)を除去することを目的としているのに対し、ブロックスイッチング手法は白箱攻撃(White-box attack)に対してより高い耐性を付与する。攻撃はFGSM[9]モデルを用いて実行され、提案するアーキテクチャがそれに続く対抗攻撃を行うことで、このアルゴリズムが実現可能な防御能力と高いセキュリティを提供することを示している。