ما الذي يتطلبه أن تكون وكيل بحث ذكاء اصطناعي جيد؟ دراسة دور تنوع التفكير الإبداعي

الملخص
تقدم وكلاء البحث بالذكاء الاصطناعي وعْدًا بتسريع التقدم العلمي من خلال أتمتة تصميم نماذج التعلم الآلي وتنفيذها وتدريبها. ومع ذلك، لا يزال هذا المجال في مهده، ولا تُفهم بالكامل العوامل الرئيسية التي تُسهم في نجاح أو فشل مسارات هذه الوكالات. نستعرض هنا الدور الذي تلعبه التنوّع في التفكير (الإيديوسيس) في أداء الوكالات. أولاً، نحلل مسارات الوكالات على MLE-bench، وهو معيار معروف لتقييم وكلاء البحث بالذكاء الاصطناعي، عبر نماذج مختلفة وبنية مساعدة (agent scaffolds) متنوعة. تُظهر تحليلاتنا أن النماذج المختلفة وبنية المساعدة تُنتج مستويات متفاوتة من التنوّع في التفكير، وأن الوكالات الأعلى أداءً تُظهر عادةً تنوّعًا أكبر في التفكير. ثم نُجري تجربة مُحكَمة نُعدّل فيها درجة التنوّع في التفكير، ونُظهر أن الزيادة في التنوّع تؤدي إلى تحسين الأداء. وأخيرًا، نُعزّز نتائجنا من خلال تحليل معايير تقييم إضافية بخلاف التقييم التقليدي القائم على الميداليات في MLE-bench، مما يُثبت أن نتائجنا تبقى صحيحة عبر مجموعة متنوعة من مقاييس أداء الوكالات.
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.