الخوارزميات العامة تتفوق على المتخصصة في الألعاب الاستراتيجية
قدمت مجموعة من الباحثين في معهد ماساتشوستس للتكنولوجيا وشركائهم من جامعات أمريكية مرموقة، نتائج دراسة جديدة خلال المؤتمر الدولي للتعلم التمثيلي في أبريل المنصرم بريو دي جانيرو، لتدحض فرضية سائدة في مجال الذكاء الاصطناعي ونظرية الألعاب. أثبتت الأبحاث أن خوارزميات التدرج السياسي العامة قادرة على التفوق على الخوارزميات المتخصصة في نظرية الألعاب عند تدريب الشبكات العصبية على ألعاب الاستراتيجية ذات المعلومات غير المكتملة. تناولت الدراسة المسابقات ثنائية اللاعب التي تخضع لنظام المجموع الصفري، حيث يعمل فوز أحدهم على حساب خسائر الخصم. لطالما اعتمد المجتمع البحثي على خوارزميات نظرية الألعاب كحل أمثل في هذه البيئات، بينما كانت خوارزميات التدرج السياسي، التي ظهرت في التسعينيات، تُستخدم بشكل أساسي في صنع القرار الفردي. غير أن فريق البحث، بقيادة سوبهان محمدبور وجابرييلي فارينا من معهد ماساتشوستس، بالتعاون مع باحثين من جامعة تكساس وكاليفورنيا وكرنيجي ميلون ونيويورك، وجد أن هذه الخوارزميات العامة تتفوق فعلياً عند تطبيقها في بيئات متعددة العوامل. لحل مشكلة القياس الموضوعي للأداء، طوّر الفريق أداة تقييم معيارية تعتمد على مقياس يحدد قابلية استغلال الخوارزمية، والذي يقيس مدى قرب الاستراتيجية من اللعب المثالي ضد خصم افتراضي يهاجم نقاط الضعف. خضعت الأداة لاختبار على خمسة ألعاب متنوعة تتضمن نسختين من تيكتاكتو الخفي، ونسخاً معدّلة من لعبة الهكس، ولعبة الليرز دايس، حيث تصل حالات اللعب إلى ثلاثين مليار حالة معقدة. تمكّن الباحثون من تشغيل المقياس بنجاح على مساحات بحجم كبير جداً، مما مكنهم من مقارنة دقيقة لم تُجرَ من قبل. أسفرت النتائج عن تفوق واضح للشبكات العصبية المدربة على خوارزميات التدرج السياسي، ليس فقط في تقليل قابلية الاستغلال، بل أيضاً في المواجهات المباشرة ضد النماذج المدربة نظرياً. وبالمقابل، أوضح الفريق أن برمجيتهم المعيارية مفتوحة المصدر، ويمكن تشغيلها على أجهزة الكمبيوتر الشخصية العادية عبر إضافة سطر برمجي واحد إلى مكتبة OpenSpiel المعروفة، مما يسهل على الباحثين تقييم أدائهم بدقة دون الحاجة إلى حواسيب فائقة. يؤكد الباحثون أن هذه النتائج تتجاوز نطاق الألعاب الترفيهية، لتشمل بيئات العالم الحقيقي التي تتسم بعدم اليقين والمعلومات المخفية، مثل المفاوضات التجارية، والأسواق المالية، والعمليات العسكرية. ويصف خبراء الدراسة بأنها تذكير قوي بأن تحديث الأدوات الكلاسيكية في الذكاء الاصطناعي يظل مساراتاً واعدة لحل المشكلات الاستراتيجية المعقدة، لافتين إلى أهمية إعادة النظر في الأدوات المعيارية المستخدمة في تقييم أداء الوكلاء الاصطناعيين.
