Command Palette

Search for a command to run...

UltraSafety大型モデル安全性評価データセット

日付

2年前

サイズ

17.43 MB

組織

清華大学

UltraSafety データセットは、大規模モデルの安全性を評価および改善するために、人民大学、清華大学、Tencent によって共同で作成されました。 UltraSafety は、AdvBench と MaliciousInstruct から 1,000 個の安全なシード命令を導出し、Self-Instruct を使用してさらに 2,000 個の命令をブートストラップします。研究チームは AutoDAN でジェイルブレイク ヒントを手動でスクリーニングし、最終的に 830 個の高品質なジェイルブレイク ヒントを選び出しました。 UltraSafety には合計 3,000 の有害な指示が含まれており、それぞれに関連する脱獄のヒントが付いています。各有害な命令は、さまざまなセキュリティ レベルのモデルによって生成された完了結果に対応し、GPT4 によって割り当てられた評価が伴います。評価 1 は無害を意味し、評価 0 は有害を意味します。 UltraSafety データセットは、これらの詳細なセキュリティ関連の指示を通じて、潜在的なセキュリティ脅威を特定して防止できるモデルをトレーニングする研究者を支援するように設計されています。

UltraSafety.torrent
シーディング 1ダウンロード中 0ダウンロード完了 374総ダウンロード数 839
  • UltraSafety/
    • README.md
      1.53 KB
    • README.txt
      3.07 KB
      • data/
        • UltraSafety.zip
          17.43 MB

AI で AI を構築

アイデアからローンチまで — 無料の AI 共同コーディング、すぐに使える環境、最適価格の GPU で AI 開発を加速。

AI 共同コーディング
すぐに使える GPU
最適価格
今すぐ始める

Hyper Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています