
摘要
神经网络容易受到人为设计的对抗性扰动的影响。近期研究发现,对分类层施加特定修改可提升神经网络的鲁棒性。本文中,我们显式构造了一个密集正交的权重矩阵,其元素具有相同的模长,从而提出一种新型鲁棒分类器。该分类器有效避免了先前方法中存在的结构冗余问题。在干净数据上进行标准训练时,仅使用该分类器即可确保模型具备高精度与良好的鲁棒性。此外,当引入额外的对抗样本时,结合一种特殊的最坏情况损失函数,可进一步提升模型的鲁棒性。实验结果表明,所提方法在效率和性能上均优于多种当前先进的防御策略。相关代码已开源,地址为:\url{https://github.com/MTandHJ/roboc}。