HyperAIHyperAI

Command Palette

Search for a command to run...

FOA-Attack、標的移行ベースの敵対的攻撃フレームワーク

日付

2ヶ月前

組織

モハメド・ビン・ザイード人工知能大学

Paper URL

2505.21494

特徴最適アライメント攻撃(FOA攻撃)は、2025年5月に南洋理工大学、ムハンマド・ビン・ザイード人工知能大学、その他の大学や研究機関の研究チームによって共同で提案されました。関連する研究成果は論文「…」に掲載されました。特徴最適アライメントによるクローズドソースMLLMに対する敵対的攻撃この提案は NeurIPS 2025 に採択されました。

FOA-Attackは、最適な特徴量のアライメントに基づく、標的を絞った移転可能な敵対的攻撃手法です。グローバルレベルでは、このパラダイムはコサイン類似度に基づくグローバル特徴量損失を導入し、敵対的サンプルの粗粒度の特徴量をターゲットサンプルの特徴量とアライメントさせます。ローカルレベルでは、Transformerの豊富なローカル表現を活用し、クラスタリング技術を用いてコンパクトなローカルパターンを抽出し、冗長なローカル特徴量を削減します。広範な実験により、FOA-Attackは最先端の標的型敵対的攻撃手法よりも優れた性能を示し、オープンソースとクローズドソースの両方のMLLMにおいて優れた移転可能性を実現することが実証されています。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています