HyperAIHyperAI

Command Palette

Search for a command to run...

安全性比較方法:深層視覚安全プロンプト

日付

11時間前

Paper URL

2506.09353

Deep Aligned Visual Safety Prompt (DAVSP) は、2025 年 11 月に清華大学の研究チームによって提案され、関連する研究結果は「DAVSP:深層整合型視覚安全プロンプトによる大規模視覚言語モデルの安全性整合「AAAI 2026に採択されました。」

DAVSPは、大規模言語視覚モデル(LVLM)向けの新しい安全なアライメント手法であり、無害なクエリに対する実用性を維持しながら、LVLMの悪意のあるクエリに対する耐性を効果的に向上させます。この手法は、入力画像の周囲に学習可能なパディング領域を視覚的なセキュリティキューとして構築し、元の視覚的特徴を保持し、ピクセル摂動によって引き起こされるパフォーマンスのボトルネックを排除することで、視覚的セキュリティキュー(VSP)によるパラダイムシフトを実現します。この研究では、ディープアライメント(DA)と呼ばれる新しい学習戦略も提案しています。LVLMが本質的にその活性化空間に有害な情報をエンコードしているという観察に基づき、研究者らは、悪意のあるクエリと良性のクエリを区別するモデルの内部表現における意味方向を捉える有害ベクトルを構築します。

DAVSPの概要

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています