
要約
ニューラルネットワークは、意図的に設計された敵対的摂動に対して脆弱である。近年の研究では、分類層に特定の変更を加えることで、ニューラルネットワークのロバスト性を向上させることの可能性が示されている。本論文では、要素の絶対値がすべて等しい密な直交重み行列を明示的に構築することで、新たなロバストな分類器を提案する。この提案手法は、従来の研究で見られた望ましくない構造的冗長性の問題を回避する。この分類器を清浄データ上の標準的な学習に適用するだけで、モデルの高い精度と優れたロバスト性を確保できる。さらに、追加の敵対的サンプルを用いる場合、特別なワーストケース損失を活用することで、さらなるロバスト性の向上が可能となる。実験結果から、本手法は効率的であり、多くの最先端の防御手法と比較しても競争力を持つことが示された。本研究のコードは、\url{https://github.com/MTandHJ/roboc} にて公開されている。