HyperAIHyperAI

Command Palette

Search for a command to run...

هونست: قياس إكمال الجملة الضارة في نماذج اللغة

Dirk Hovy Federico Bianchi Debora Nozza

الملخص

أحدثت نماذج اللغة ثورة في مجال معالجة اللغة الطبيعية. ومع ذلك، فإن نماذج اللغة تُسجّل وتنشر أشكالاً من التحيّزات المؤذية، خصوصاً في إنشاء النصوص. تُظهر نتائجنا أن نماذج اللغة تكمل جملة بعبارة مؤذية في 4.3% من المرات. ولا تحدث هذه الحالات بشكل عشوائي، بل تتبع أنماطاً لغوية وجندرية محددة. نقترح مؤشراً لقياس إكمال الجمل المؤذية في نماذج اللغة (HONEST)، والذي يستخدم منهجية تقييم منهجية قائمة على القوالب والقواميس لتقييم التحيّز في ست لغات. تشير نتائجنا إلى أن هذه النماذج تُعيد إنتاج وتكبير التحيّزات المجتمعية العميقة المتعلقة بالأدوار الجندرية. حيث يشير إكمال الجمل إلى التحرّش الجنسي عندما يكون الهدف أنثى في 9% من الحالات، ويتناول المثلية الجنسية في 4% من الحالات عندما يكون الهدف ذكراً. تثير هذه النتائج تساؤلات حول استخدام هذه النماذج في البيئات الإنتاجية.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
هونست: قياس إكمال الجملة الضارة في نماذج اللغة | مستندات | HyperAI