Command Palette
Search for a command to run...
FOA-Attack, Un Cadre d'attaque Adverse Ciblé Basé Sur La Migration
L’attaque par alignement optimal des caractéristiques (FOA-Attack) a été proposée conjointement en mai 2025 par une équipe de recherche de l’Université technologique de Nanyang, de l’Université Muhammad Bin Zayed pour l’intelligence artificielle et d’autres universités et institutions. Les résultats de cette recherche ont été publiés dans l’article « ... ».Attaques adverses contre les MLLM à code source fermé via l'alignement optimal des caractéristiquesLa proposition a été acceptée par NeurIPS 2025.
FOA-Attack est une méthode d'attaque adverse ciblée et transférable, basée sur un alignement optimal des caractéristiques. Au niveau global, ce paradigme introduit une perte de caractéristiques globale basée sur la similarité cosinus afin d'aligner les caractéristiques grossières de l'exemple adverse avec celles de l'échantillon cible. Au niveau local, tirant parti des riches représentations locales du Transformer, ce paradigme utilise des techniques de clustering pour extraire des motifs locaux compacts, réduisant ainsi les caractéristiques locales redondantes. De nombreuses expériences démontrent que FOA-Attack surpasse les méthodes d'attaque adverses ciblées de pointe et offre une transférabilité supérieure sur les modèles de langage naturel (MLLM) open source et propriétaires.
Build AI with AI
From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.