مجموعة بيانات حوكمة النموذج الصيني الكبير 100 PoisonMpts
التاريخ
الحجم
رابط النشر
العلامات
الفئات
مع التطور السريع لنماذج اللغة الكبيرة (LLMs)، بدأ عدد متزايد من الأشخاص يشعرون بالقلق بشأن بعض المخاطر التي قد تحملها. ولذلك، حظي الاتجاه "الآمن والأحادي اللون" حول النماذج الكبيرة باهتمام كبير.
100PoisonMpts هي أول مجموعة بيانات صينية مفتوحة المصدر في الصناعة لحوكمة نماذج اللغة الكبيرة. تتكون الدفعة الأولى من مهندسي التعليقات التوضيحية لـ "100 زجاجة سم للذكاء الاصطناعي" من أكثر من اثني عشر خبيرًا وباحثًا معروفين، بما في ذلك خبير علم الاجتماع البيئي فان ييتشاو، وعالم الاجتماع الشهير لي يين هي، وعالم النفس لي سونغ وي، وخبير قانون حقوق الإنسان ليو شياونان.قام كل معلق بطرح 100 سؤال صعب أدت إلى إجابات متحيزة وتمييزية، وقاموا بشرح إجابات النموذج الكبير، واستكملوا الهجوم والدفاع باستخدام الذكاء الاصطناعي من "التسميم" إلى "إزالة السموم". وتدور الدفعة الأولى من البيانات الميدانية حول مكافحة التمييز والتعاطف والتعبير الاستشاري باستخدام الذكاء الاصطناعي، وقد غطت أبعادًا مثل الفقه وعلم النفس وتعليم الأطفال وإمكانية الوصول والحقائق غير المعروفة والعلاقات الحميمة والعدالة البيئية. ويتضمن أسئلة يطرحها الخبراء وأجوبة يكتبها الخبراء أو يوافقون عليها.
قام فريق البحث باستكشاف محاذاة ذاتية للنماذج الكبيرة بناءً على مبدأ الخبراء. للحصول على طرق محددة والتحليل التجريبي، يرجى الرجوع إلى التقرير الفني "محاذاة ذاتية للنماذج الكبيرة بناءً على مبادئ الخبراء"وصلة
فريق البحثبناءً على معيارين للتقييم: السلامة والمسؤوليةتم اقتراح معيار لتقييم قيم مستوى النموذج واسع النطاق في الصين.لمزيد من المعلومات، يُرجى قراءة الورقة البحثية "القيم: قياس قيمة نموذج اللغة الكبير في الصين من الأمن إلى المسؤولية"وصلة