HyperAI
منذ 9 أيام

إطار إدارة مخاطر الذكاء الاصطناعي في المقدمة: تقرير تحليل المخاطر

Xiaoyang Chen, Yunhao Chen, Zeren Chen, Zhiyun Chen, Hanyun Cui, Yawen Duan, et al
إطار إدارة مخاطر الذكاء الاصطناعي في المقدمة: تقرير تحليل المخاطر
الملخص

لفهم وتحديد المخاطر غير المسبوقة التي تهدد نماذج الذكاء الاصطناعي (AI) المتقدمة بشكل سريع، تقدم هذه التقرير تقييمًا شاملاً للمخاطر الحدودية لها. استنادًا إلى تحليل E-T-C (بيئة التشغيل، مصدر التهديد، القدرة الداعمة) من إطار إدارة مخاطر الذكاء الاصطناعي الحدودي (الإصدار 1.0) (SafeWork-F1-Framework)، نحدد المخاطر الحيوية في سبعة مجالات: الهجوم السيبراني، المخاطر البيولوجية والكيميائية، التأثير والتحريض، بحوث وتطوير الذكاء الاصطناعي ذاتية التحكم، الكذب الاستراتيجي والخداع، التضاعف الذاتي، والتعاون. وتحت إشراف "قانون الذكاء الاصطناعي"، نقيّم هذه المخاطر باستخدام "خطوط حمراء" (الحدود غير المقبولة) و"خطوط صفراء" (مؤشرات تحذير مبكر) لتحديد مناطق المخاطر: الخضراء (المخاطر القابلة للإدارة للاستخدام اليومي والمراقبة المستمرة)، والصفراء (التي تتطلب تخفيفًا محسّنًا وتشغيلًا مراقبًا)، والحمراء (التي تتطلب تعليقًا في التطوير والتشغيل). أظهرت النتائج التجريبية أن جميع نماذج الذكاء الاصطناعي الحدودية الحديثة تقع في مناطق خضراء وصفراء، دون تجاوز حدود الحمراء. بشكل خاص، لا تتجاوز أي من النماذج المقيّمة الخط الأصفر في مجال الهجوم السيبراني أو مخاطر بحوث وتطوير الذكاء الاصطناعي ذاتية التحكم. أما في مجال التضاعف الذاتي والخداع الاستراتيجي والخداع، فإن معظم النماذج تظل في المنطقة الخضراء، باستثناء بعض النماذج في المنطقة الصفراء. في مجال التأثير والتحريض، تقع معظم النماذج في المنطقة الصفراء نظرًا لتأثيرها الفعال على البشر. أما في مجال المخاطر البيولوجية والكيميائية، فلا يمكننا استبعاد احتمال أن تقع معظم النماذج في المنطقة الصفراء، على الرغم من أن نماذج التهديد والتحليل العميق ضروريان لاستنتاجات أكثر دقة. تُظهر هذه الدراسة فهمنا الحالي للمخاطر الحدودية للذكاء الاصطناعي، وتدعو إلى اتخاذ إجراءات جماعية لمواجهة هذه التحديات.