11日前
敵対的訓練におけるロバスト表現の強化:アライメントと除外基準
Nuoyan Zhou, Nannan Wang, Decheng Liu, Dawei Zhou, Xinbo Gao

要約
深層ニューラルネットワークは敵対的ノイズに対して脆弱である。敵対的訓練(Adversarial Training, AT)は、ネットワークが欺かれるのを防ぐために最も効果的な防御戦略であることが実証されている。しかし、本研究ではATがロバストな特徴の学習を省略していることにより、敵対的ロバスト性の性能が不十分であることを発見した。この問題に対処するため、ロバストな表現を獲得する上で重要な2つの基準を提示する:(1)除外(Exclusion):異なるクラスの例の特徴が互いに離れて存在すること;(2)整合(Alignment):自然な入力とその対応する敵対的例の特徴が互いに近接すること。これらの知見に基づき、非対称な負例対比(asymmetric negative contrast)と逆注意(reverse attention)を用いて、ATの汎用的枠組みを提案する。具体的には、予測確率に基づく非対称な負例対比を設計し、特徴空間内で異なるクラスの例を遠ざける。さらに、線形分類器のパラメータによって特徴に重みを付与する逆注意を導入することで、クラスに依存した特徴を獲得し、同一クラスの例の特徴を近づける。3つのベンチマークデータセットにおける実証評価により、本手法がATのロバスト性を著しく向上させ、最先端の性能を達成することを示した。