Une approche intégrée de défense basée sur l’Auto-Encoder et le Commutateur de Blocs pour prévenir les attaques adversariales

Selon des études récentes, la vulnérabilité des réseaux de neurones de pointe aux échantillons d’entrée adverses a considérablement augmenté. Un réseau de neurones est une méthode intermédiaire par laquelle un ordinateur apprend à effectuer des tâches à l’aide d’algorithmes d’apprentissage automatique. Les modèles d’apprentissage automatique et d’intelligence artificielle sont devenus une composante fondamentale de la vie quotidienne, notamment dans les voitures autonomes [1] ou les dispositifs intelligents pour le foyer, de sorte que toute vulnérabilité soulève une préoccupation majeure. De très petites perturbations dans les entrées peuvent tromper ces systèmes extrêmement littéraux, induisant ainsi en erreur à la fois les utilisateurs et les administrateurs, les plaçant dans des situations critiques. Cet article propose un algorithme de défense fondé sur la combinaison d’un auto-encodeur [3] et d’une architecture à commutation par blocs. L’auto-encodeur a pour objectif d’éliminer toute perturbation présente dans les images d’entrée, tandis que la méthode de commutation par blocs vise à renforcer la résistance aux attaques du type « blanc-box ». L’attaque est conçue à l’aide du modèle FGSM [9], et la riposte contre-attaque du système proposé est ensuite déclenchée, démontrant ainsi la faisabilité et la sécurité offertes par l’algorithme.