دراسة جديدة من MIT تكشف تحديات إدارة الذكاء الاصطناعي الأذكى: نسب النجاح قد تنخفض لأقل من 52٪
بحث جديد من معهد ماساتشوستس للتكنولوجيا (MIT) يُسلِّط الضوء على تحديات إشراف البشر على الذكاء الاصطناعي (AI). أظهرت الدراسة أن فعالية الإشراف البشري قد تنخفض بشكل كبير إذا زادت الفجوة بين مستوى الذكاء الاصطناعي المراقب والذكاء الاصطناعي المراقب عليه. وفقًا للباحثين، يمكن تحسين نجاح الإشراف البشري من خلال زيادة عدد الخطوات التي يتخذها الإنسان للتحقق من الذكاء الاصطناعي، خاصة عندما تكون الفجوة في القدرات العامة (Δgeneral) كبيرة. ومع ذلك، كلما ازدادت الصعوبة الخاصة بمهمة الذكاء الاصطناعي (Δdomain)، أصبح الإشراف أكثر تعقيدًا حتى لو كانت الفجوة في القدرات العامة صغيرة. كشفت الدراسة أيضًا عن ظاهرة مثيرة للاهتمام: في بعض الحالات، زيادة الفجوة في القدرات العامة قد تجعل الإشراف أسهل. هذا يعود إلى أن الذكاء الاصطناعي المراقب يكون أقل قدرة على التنبؤ بسلوك الذكاء الاصطناعي المراقب عليه، مما يوفر مزيدًا من "المجال للمناورة" في استراتيجيات الإشراف. في لعبة "Houdini"، عندما تكون الفجوة في القدرات العامة أصغر من الصعوبة الخاصة بالمهمة (Δgeneral < Δdomain)، يكون الإشراف من خطوة واحدة هو الحل الأمثل. ومع زيادة الفجوة في القدرات العامة، تنخفض معدلات نجاح الإشراف. على سبيل المثال، عندما تبلغ الفجوة في القدرات العامة 400 نقطة Elo (ما يعادل الفجوة بين GPT-4.o-latest و Gemini-1.5-Flash في ساحة الدردشة Chatbot Arena)، تكون معدلات النجاح في الإشراف على ألعاب مثل Wargames حوالي 9.8٪، وعلى Mafia حوالي 25٪، وعلى Backdoor Code حوالي 32٪، بينما تبلغ أعلى معدلات النجاح في Debate حوالي 51.4٪. هذه النتائج تشير إلى أنه حتى باستخدام أفضل استراتيجيات الإشراف المتوفرة حاليًا، قد يصبح من الصعب للغاية إشراف البشر على الذكاء الاصطناعي في المستقبل، خاصة إذا تجاوز الذكاء الاصطناعي المستويات الحالية بكثير. ومع ذلك، يوضح الباحثون أن هذه الدراسة لها حدود: الألعاب المستخدمة في الإشراف هي نماذج مبسطة؛ السلوكيات "الغش" للذكاء الاصطناعي تنشأ من الاستدلال الخاطئ وليس التدريب الحقيقي؛ وتقوم نظرية NSO على افتراضات نظرية طويلة. رغم هذه الحدود، تعتبر هذه الدراسة خطوة مهمة في مجال أمان الذكاء الاصطناعي، حيث تقدم إطارًا نظريًا لفهم فعالية الإشراف البشري على الذكاء الاصطناعي. كما تؤكد على أهمية تصميم قواعد اللعبة بحيث تكون أكثر صرامة وفعالية، بما يسمح للإنسان بالاحتفاظ بميزة على الذكاء الاصطناعي، حتى في حالات زيادة قدراته. المصادر: 1. https://arxiv.org/abs/2504.18530 2. https://www.lesswrong.com/posts/x59FhzuM9yuvZHAHW/untitled-draft-yhra التنظيم/الترتيب: وليد صبحي
