HyperAIHyperAI

Command Palette

Search for a command to run...

مجموعة بيانات تقييم السلامة النموذجية الكبيرة من UltraSafety

التاريخ

منذ 2 أعوام

الحجم

17.43 MB

المؤسسة

جامعة تسينغهوا

العلامات

تم إنشاء مجموعة بيانات UltraSafety بشكل مشترك من قبل جامعة رينمين الصينية وجامعة تسينغهوا وشركة Tencent لتقييم وتحسين سلامة النماذج الكبيرة. يستمد UltraSafety 1000 تعليمة أساسية للسلامة من AdvBench وMaliciousInstruct، ويستخدم Self-Instruct لتوجيه 2000 تعليمة أخرى. قام فريق البحث بفحص مطالبات كسر الحماية يدويًا في AutoDAN وفي النهاية حدد 830 مطالبة كسر حماية عالية الجودة. يحتوي UltraSafety على إجمالي 3000 تعليمة ضارة، كل منها مع نصائح كسر الحماية المرتبطة بها. تتوافق كل تعليمات ضارة مع نتيجة الإكمال التي تم إنشاؤها بواسطة نموذجنا عند مستويات أمان مختلفة، وتكون مصحوبة بتصنيف معين بواسطة GPT4، حيث يشير التصنيف 1 إلى عدم الضرر ويشير التصنيف 0 إلى الضرر. تم تصميم مجموعة بيانات UltraSafety لمساعدة الباحثين في تدريب النماذج التي يمكنها تحديد ومنع التهديدات المحتملة للسلامة من خلال هذه التعليمات التفصيلية المتعلقة بالسلامة.

UltraSafety.torrent
البذر 2التنزيل 0مكتمل 374إجمالي التنزيلات 839
  • UltraSafety/
    • README.md
      1.53 KB
    • README.txt
      3.07 KB
      • data/
        • UltraSafety.zip
          17.43 MB

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
مجموعة بيانات تقييم السلامة النموذجية الكبيرة من UltraSafety | مجموعات البيانات | HyperAI