HyperAIHyperAI
vor 2 Monaten

PuVAE: Ein variationeller Autoencoder zur Reinigung feindseliger Beispiele

Uiwon Hwang; Jaewoo Park; Hyemi Jang; Sungroh Yoon; Nam Ik Cho
PuVAE: Ein variationeller Autoencoder zur Reinigung feindseliger Beispiele
Abstract

Tiefe neuronale Netze werden weit verbreitet eingesetzt und zeigen in vielen Bereichen ausgezeichnete Leistungen. Sie sind jedoch anfällig für feindselige Angriffe, die das Netzwerk während der Inferenz durch sorgfältig gestaltete Störungen an den Eingangsdaten gefährden. Obwohl mehrere Verteidigungsstrategien vorgeschlagen wurden, um spezifische Angriffe abzuwehren, können andere Angriffsmethoden diese Schutzmechanismen umgehen. Daher schlagen wir den Purifying Variational Autoencoder (PuVAE) vor, eine Methode zur Reinigung von feindseligen Beispielen. Das vorgeschlagene Verfahren eliminiert eine feindselige Störung, indem es ein feindseliges Beispiel auf die Mannigfaltigkeit jeder Klasse projiziert und die nächstgelegene Projektion als gereinigtes Beispiel bestimmt. Wir veranschaulichen experimentell die Robustheit des PuVAE gegen verschiedene Angriffsmethoden ohne irgendein Vorwissen. In unseren Experimenten zeigt das vorgeschlagene Verfahren Leistungen, die mit denen der besten bisher bekannten Verteidigungsverfahren konkurrieren können, und die Inferenzzeit ist etwa 130-mal schneller als bei dem Defense-GAN, einem der besten bisher bekannten Reinigungsmodelle.