HyperAIHyperAI

Command Palette

Search for a command to run...

FOA-Attack、標的移行ベースの敵対的攻撃フレームワーク

Date

2ヶ月前

Organization

モハメド・ビン・ザイード人工知能大学

Paper URL

2505.21494

特徴最適アライメント攻撃(FOA攻撃)は、2025年5月に南洋理工大学、ムハンマド・ビン・ザイード人工知能大学、その他の大学や研究機関の研究チームによって共同で提案されました。関連する研究成果は論文「…」に掲載されました。特徴最適アライメントによるクローズドソースMLLMに対する敵対的攻撃この提案は NeurIPS 2025 に採択されました。

FOA-Attackは、最適な特徴量のアライメントに基づく、標的を絞った移転可能な敵対的攻撃手法です。グローバルレベルでは、このパラダイムはコサイン類似度に基づくグローバル特徴量損失を導入し、敵対的サンプルの粗粒度の特徴量をターゲットサンプルの特徴量とアライメントさせます。ローカルレベルでは、Transformerの豊富なローカル表現を活用し、クラスタリング技術を用いてコンパクトなローカルパターンを抽出し、冗長なローカル特徴量を削減します。広範な実験により、FOA-Attackは最先端の標的型敵対的攻撃手法よりも優れた性能を示し、オープンソースとクローズドソースの両方のMLLMにおいて優れた移転可能性を実現することが実証されています。

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています