
要約
最近の敵対的攻撃手法に関する研究進展にもかかわらず、現在のXAIモニタに対抗する手法は依然として検出されやすく、処理速度も遅いという課題がある。本論文では、XAIモニタ下において、隠密性、説明可能性、効率性を兼ね備えたPGD画像分類敵対的攻撃を実現するための適応型アテンションマスク生成フレームワークを提案する。具体的には、アテンションマスク生成に向け、突然変異XAI混合モデルとマルチタスク自己教師付きX-UNetを活用し、PGD攻撃をガイドする。MNIST(MLP)およびCIFAR-10(AlexNet)における実験結果から、本システムは、隠密性、効率性、説明可能性のバランスにおいて、従来のPGD、Sparsefoolおよび最先端のSINIFGSMを上回ることを示した。このバランスの取れた性能は、最先端の防御対策を備えた分類器を効果的に欺く上で極めて重要である。