2ヶ月前

対抗的サンプルの説明と活用

Ian J. Goodfellow; Jonathon Shlens; Christian Szegedy
対抗的サンプルの説明と活用
要約

いくつかの機械学習モデル、特にニューラルネットワークは、敵対的サンプル(データセットの例に小さなが意図的に最悪な摂動を加えて形成された入力)を一貫して誤分類する傾向がある。これらの摂動が加えられた入力は、モデルが高確信で誤った答えを出力させる結果となる。この現象の初期的な説明では、非線形性と過学習に焦点が当てられていた。しかし、我々はニューラルネットワークが敵対的摂動に対して脆弱である主な原因はその線形性にあると主張する。この説明は新しい定量的な結果によって支持されており、それらについて最も興味深い事実である「アーキテクチャや訓練セットを超えた一般化」の最初の説明を提供している。さらに、この見解に基づく方法は、敵対的サンプルを生成するための単純かつ高速な手段を提供する。この手法を使用して敵対的訓練を行うことで、MNISTデータセットにおけるマックスアウトネットワークのテストセットエラーを低減させた。注:「maxout network」(マックスアウトネットワーク)、「MNIST dataset」(MNISTデータセット)などの専門用語については一般的な日本語訳を使用しました。「adversarial examples」(敵対的サンプル)、「adversarial perturbation」(敵対的摂動)なども同様です。