Command Palette

Search for a command to run...

建設的セキュリティ調整(CSA)

日付

4日前

組織

南洋理工大学
復旦大学
清華大学

論文URL

2509.01909

タグ

建設的安全性アライメント(CSA)は、2025年9月にアリババグループのセキュリティ部門と清華大学などの大学によって共同で提案されました。関連する研究結果は論文「[…]」に掲載されました。Oyster-I: 拒否を超えて - 責任ある言語モデルのための建設的な安全性アライメント”。

大規模言語モデル(LLM)は通常、有害なコンテンツの生成を防ぐためのセキュリティメカニズムを導入します。CSA(コンテンツセーフティ)は、悪意のある不正使用を防ぐだけでなく、悪意のないユーザーを安全で有益な結果へと積極的に導きます。受動的な防御や包括的な拒否にとどまらず、セキュリティを二重の責任と捉え、安全で有益なガイダンスへと進化させます。つまり、セキュリティは害を防ぐだけでなく、ユーザーが正当かつ信頼できる解決策を見つけられるように支援するという二重の責任を持つのです。

AI で AI を構築

アイデアからローンチまで — 無料の AI 共同コーディング、すぐに使える環境、最適価格の GPU で AI 開発を加速。

AI 共同コーディング
すぐに使える GPU
最適価格
今すぐ始める

Hyper Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています