ذكاء اصطناعي يتفوق بـ 82%
نجح باحثون من مختبر علوم الحاسوب والذكاء الاصطناعي في معهد ماساتشوستس للتكنولوجيا وكلية الهندسة والعلوم التطبيقية بجامعة هارفارد في تعزيز قدرة النماذج اللغوية الكبيرة على طرح الأسئلة الفعالة، مما يرفع كفاءة وكلاء الذكاء الاصطناعي في بيئات البحث العلمي والتطوير. اعتمد الفريق على لعبة البلياردو البحرية التعاونية لقياس الأداء، حيث يتعاون قبطان يطرح استفسارات مع مراقب يجيب عنها في الوقت الفعلي، مما وفر مجموعة بيانات إنسانية معيارية للمقارنة. أظهرت التجربة تحسناً قياسياً، إذ ارتفعت نسبة فوز النموذج الصغير Llama 4 Scout على اللاعبين البشر من ثمانية بالمائة إلى اثنين وثمانين بالمائة، متفوقاً في إكمال الجولات على نماذج الحدود الحالية مثل GPT-5 بتكلفة حوسبة لا تتجاوز واحد بالمائة من تكلفتها. ولتحقيق هذا الإنجاز، طبّق الباحثون استراتيجية استنتاج مونت كارلو التي تقيس احتمالية صحة الخيارات تدريجياً مع كل رد، مما يتيح للنموذج تركيز استفساراته على المناطق الأكثر إفادة للمعلومات. كما عمل الفريق على سد الفجوة في دقة الإجابات عبر تحويل الأسئلة تلقائياً إلى أكواد برمجية تنفيذية تفهمها الآلة بدقة، مثل أوامر البحث المكاني المحددة. أسهم هذا النهج في رفع متوسط دقة الإجابات بنسبة خمسة عشر بالمائة، مع قفزات أداء ملحوظة للنماذج متوسطة وكبيرة الحجم. وتعرضت النتائج علناً خلال مؤتمر ICLR في أبريل من العام الجاري 2026. يؤكد القائمون على الدراسة أن تحسين قدرة النماذج على طرح الأسئلة يعتمد بشكل أساسي على نمذجة العالم والتنبؤ بنتائج التفاعلات، مما يعزز قدرتها على استكشاف الحلول النادرة في مساحات بحثية شاسعة. ويشير الفريق إلى أن هذه التقنيات قابلة للتوسيع لتطبيقات البرمجة وحل المشكلات الرياضية، مع الإشارة إلى أن التحديات المستقبلية ستتركز على التعامل مع الأسئلة المعقدة، وتحسين التنسيق الاجتماعي بين البشر والآلات في بيئات تعاونية ديناميكية. تبرز هذه الدراسات أن العائق الحقيقي أمام وكلاء الذكاء الاصطناعي لم يعد حسابياً فحسب، بل يتحول نحو المنطق التطبيقي واستخراج أقصى قيمة من المعلومات المتاحة، مما يمهد الطريق لجيل أكثر ذكاءً وكفاءة من الأنظمة الذاتية.
