HyperAIHyperAI
il y a 15 jours

Classification robuste à l’aide d’un seul modèle de diffusion

Huanran Chen, Yinpeng Dong, Zhengyi Wang, Xiao Yang, Chengqi Duan, Hang Su, Jun Zhu
Classification robuste à l’aide d’un seul modèle de diffusion
Résumé

Les modèles de diffusion ont été appliqués pour améliorer la robustesse aux attaques adverses des classificateurs d’images, soit en purifiant les bruits adverses, soit en générant des données réalistes pour l’entraînement adversaire. Toutefois, la purification basée sur les modèles de diffusion peut être contournée par des attaques adaptatives plus puissantes, tandis que l’entraînement adversaire se révèle peu performant face à des menaces inconnues, révélant ainsi des limites intrinsèques de ces approches. Afin d’exploiter plus efficacement le pouvoir d’expression des modèles de diffusion, ce papier propose le Robust Diffusion Classifier (RDC), un classificateur génératif construit à partir d’un modèle de diffusion pré-entraîné, conçu pour être robuste aux attaques adverses. Le RDC maximise d’abord la vraisemblance des données associée à une entrée donnée, puis prédit les probabilités de classe de cette entrée optimisée en utilisant la vraisemblance conditionnelle estimée par le modèle de diffusion via le théorème de Bayes. Pour réduire davantage le coût computationnel, nous proposons un nouvel arrière-plan de diffusion appelé diffusion à plusieurs têtes, ainsi que des stratégies d’échantillonnage efficaces. Étant donné que le RDC n’exige pas d’entraînement spécifique aux attaques adverses, nous démontrons qu’il est plus généralisable pour se défendre contre plusieurs menaces inconnues. En particulier, le RDC atteint une précision robuste de 75,67 % contre diverses attaques adaptatives bornées par la norme ℓ∞ avec ε∞ = 8/255 sur CIFAR-10, surpassant les modèles d’entraînement adversaire les plus avancés précédemment publiés de +4,77 %. Ces résultats mettent en évidence le potentiel des classificateurs génératifs fondés sur des modèles de diffusion pré-entraînés pour la robustesse aux attaques adverses, par rapport aux classificateurs discriminatifs couramment étudiés. Le code est disponible à l’adresse \url{https://github.com/huanranchen/DiffusionClassifier}.

Classification robuste à l’aide d’un seul modèle de diffusion | Articles de recherche récents | HyperAI