HyperAI

نجح باحثون من مختبر علوم الحاسوب والذكاء الاصطناعي في معهد ماساتشوستس للتكنولوجيا وكلية الهندسة والعلوم التطبيقية بجامعة هارفارد في تعزيز قدرة النماذج اللغوية الكبيرة على طرح الأسئلة الفعالة، مما يرفع كفاءة وكلاء الذكاء الاصطناعي في بيئات البحث العلمي والتطوير. اعتمد الفريق على لعبة البلياردو البحرية التعاونية لقياس الأداء، حيث يتعاون قبطان يطرح استفسارات مع مراقب يجيب عنها في الوقت الفعلي، مما وفر مجموعة بيانات إنسانية معيارية للمقارنة. أظهرت التجربة تحسناً قياسياً، إذ ارتفعت نسبة فوز النموذج الصغير Llama 4 Scout على اللاعبين البشر من ثمانية بالمائة إلى اثنين وثمانين بالمائة، متفوقاً في إكمال الجولات على نماذج الحدود الحالية مثل GPT-5 بتكلفة حوسبة لا تتجاوز واحد بالمائة من تكلفتها. ولتحقيق هذا الإنجاز، طبّق الباحثون استراتيجية استنتاج مونت كارلو التي تقيس احتمالية صحة الخيارات تدريجياً مع كل رد، مما يتيح للنموذج تركيز استفساراته على المناطق الأكثر إفادة للمعلومات. كما عمل الفريق على سد الفجوة في دقة الإجابات عبر تحويل الأسئلة تلقائياً إلى أكواد برمجية تنفيذية تفهمها الآلة بدقة، مثل أوامر البحث المكاني المحددة. أسهم هذا النهج في رفع متوسط دقة الإجابات بنسبة خمسة عشر بالمائة، مع قفزات أداء ملحوظة للنماذج متوسطة وكبيرة الحجم. وتعرضت النتائج علناً خلال مؤتمر ICLR في أبريل من العام الجاري 2026. يؤكد القائمون على الدراسة أن تحسين قدرة النماذج على طرح الأسئلة يعتمد بشكل أساسي على نمذجة العالم والتنبؤ بنتائج التفاعلات، مما يعزز قدرتها على استكشاف الحلول النادرة في مساحات بحثية شاسعة. ويشير الفريق إلى أن هذه التقنيات قابلة للتوسيع لتطبيقات البرمجة وحل المشكلات الرياضية، مع الإشارة إلى أن التحديات المستقبلية ستتركز على التعامل مع الأسئلة المعقدة، وتحسين التنسيق الاجتماعي بين البشر والآلات في بيئات تعاونية ديناميكية. تبرز هذه الدراسات أن العائق الحقيقي أمام وكلاء الذكاء الاصطناعي لم يعد حسابياً فحسب، بل يتحول نحو المنطق التطبيقي واستخراج أقصى قيمة من المعلومات المتاحة، مما يمهد الطريق لجيل أكثر ذكاءً وكفاءة من الأنظمة الذاتية.

الروابط ذات الصلة

الروابط ذات الصلة

الروابط ذات الصلة

Command Palette

ذكاء اصطناعي يتفوق بـ 82%

الروابط ذات الصلة

Command Palette

ذكاء اصطناعي يتفوق بـ 82%

الروابط ذات الصلة

Command Palette

ذكاء اصطناعي يتفوق بـ 82%

الروابط ذات الصلة