2ヶ月前
理論的に裏付けられた堅牢性と精度のトレードオフ
Hongyang Zhang; Yaodong Yu; Jiantao Jiao; Eric P. Xing; Laurent El Ghaoui; Michael I. Jordan

要約
我々は、対抗的例に対する防御設計の指針となる堅牢性と精度のトレードオフを特定しました。この問題は経験的に広く研究されてきましたが、その基礎理論についてはまだ多くのことが不明です。本研究では、対抗的例の予測誤差(堅牢誤差)を自然な誤差(分類誤差)と境界誤差の和に分解し、分類校正損失の理論を使用して微分可能な上限を提供します。これは、すべての確率分布と測定可能な予測器に対して一様に最も厳密な上限であることが示されています。我々の理論解析に基づいて、さらに新しい防御手法であるTRADESを設計し、対抗的な堅牢性と精度とのトレードオフを調整します。提案したアルゴリズムは実際のデータセットで実験的に優れた性能を発揮しました。この方法論は、NeurIPS 2018 対抗的ビジョンチャレンジへの参加の基礎となりました。当該チャレンジにおいて、約2,000件の提出の中から1位を獲得し、2位の手法よりも平均$\ell_2$摂動距離で11.41%上回りました。