HyperAIHyperAI
il y a 11 jours

Un classificateur orthogonal pour améliorer la robustesse contre les attaques adverses des réseaux de neurones

Cong Xu, Xiang Li, Min Yang
Un classificateur orthogonal pour améliorer la robustesse contre les attaques adverses des réseaux de neurones
Résumé

Les réseaux de neurones sont sensibles aux perturbations adverses conçues artificiellement. Des travaux récents ont montré qu’imposer certaines modifications à la couche de classification peut améliorer la robustesse des réseaux de neurones. Dans cet article, nous construisons explicitement une matrice de poids orthogonale dense dont les éléments ont tous la même norme, conduisant ainsi à un nouveau classificateur robuste. Ce classificateur évite le problème de redondance structurelle indésirable présent dans les approches antérieures. L’application de ce classificateur lors d’un entraînement standard sur des données propres suffit à garantir à la fois une haute précision et une bonne robustesse du modèle. De plus, en utilisant des échantillons adverses supplémentaires, une robustesse encore supérieure peut être obtenue grâce à une fonction de perte spéciale basée sur le cas le plus défavorable. Les résultats expérimentaux montrent que notre méthode est efficace et compétitive par rapport à de nombreuses approches défensives de pointe. Notre code est disponible à l’adresse \url{https://github.com/MTandHJ/roboc}.