Command Palette
Search for a command to run...
FOA-Attack、標的移行ベースの敵対的攻撃フレームワーク
特徴最適アライメント攻撃(FOA攻撃)は、2025年5月に南洋理工大学、ムハンマド・ビン・ザイード人工知能大学、その他の大学や研究機関の研究チームによって共同で提案されました。関連する研究成果は論文「…」に掲載されました。特徴最適アライメントによるクローズドソースMLLMに対する敵対的攻撃この提案は NeurIPS 2025 に採択されました。
FOA-Attackは、最適な特徴量のアライメントに基づく、標的を絞った移転可能な敵対的攻撃手法です。グローバルレベルでは、このパラダイムはコサイン類似度に基づくグローバル特徴量損失を導入し、敵対的サンプルの粗粒度の特徴量をターゲットサンプルの特徴量とアライメントさせます。ローカルレベルでは、Transformerの豊富なローカル表現を活用し、クラスタリング技術を用いてコンパクトなローカルパターンを抽出し、冗長なローカル特徴量を削減します。広範な実験により、FOA-Attackは最先端の標的型敵対的攻撃手法よりも優れた性能を示し、オープンソースとクローズドソースの両方のMLLMにおいて優れた移転可能性を実現することが実証されています。
Build AI with AI
From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.